4-3-5- محاسبه دقیق مقدار اعتماد یا امتیاز رابطه میان دو کاربر……………………….71
4-3-6- محاسبه ترکیبی امتیاز رابطه میان کاربران………………………………………..73
فصل پنجم : تشریح روند انجام آزمایشات و نتایج حاصل………………………………76
5-1- مقدمه…………………………………………………………………………………………77
5-2- معرفی مجموعه داده epinions……………………………………………………………..
5-2-1- ویژگیهای مجموعه داده epinions…………………………………………………….
5-2-2- آماده سازی و نحوه پالایش داده ها………………………………………………81
5-2-3- ایجاد مجموعه داده نمونه…………………………………………………………………83
5-3- مجموعه داده movielens………………………………………………………………..
5-3-1- ویژگیهای مجموعه داده movielens……………………………………………….
5-4- نیازمندیهای نرم افزاری………………………………………………………………………85
5-5- نیازمندیهای سخت افزاری………………………………………………………………….85
5-6- متدولوژی نرم افزاری…………………………………………………………………………86
5-7- پارامترهای پیش فرض انجام آزمایشات……………………………………………..86
5-8- نتایج اجرای آزمایشات با مجموعه داده epinions و movielens……………..
5-8-1- بررسی تاثیر عمق پیمایش بر روی نتایج حاصل در خصوص کاربران تازه وارد…87
5-8-2- بررسی تاثیر تاریخ اعلام نظرات توسط کاربران…………………………………88
5-8-3- بررسی تاثیر تغییر فرمول محاسبه تشابه آیتمها………………………………..89
5-8-4- بررسی تاثیر بکارگیری مکانیزم تفسیر و تعدیل نظرات کاربران……………….90
5-8-5- بررسی تاثیر بکارگیری انواع روش های ترکیبی برای انتخاب کاربران و پیمایش شبکه…..93
5-8-5-1- نحوه محاسبه امتیاز رابطه موجود میان کاربران……………………………………..93
5-8-5-2- بررسی تاثیر بکارگیری روش های ترکیبی در عملکرد سیستم برای تمامی کاربران…….94
5-8-5-3- بررسی تاثیر بکارگیری روش های ترکیبی در عملکرد سیستم برای کاربران تازه وارد …..99
5-8-6- بررسی تاثیر بکارگیری توام مکانیزم تفسیر امتیازات کاربران به همراه استفاده از روش های ترکیبی انتخاب کاربران و پیمایش شبکه اعتماد……………………………………101
5-9- انجام آزمایشات با مجموعه داده movielens…………………………………..
5-9-1- نتایج حاصل از اجرای روش های ترکیبی مورد استفاده در مدل توسعه یافته……107
فصل ششم : نتیجه گیری نهایی و کارهای آینده…………………………………………….110
6-1- مقدمه…………………………………………………………………………………111
6-2- عملکرد مدل توسعه یافته……………………………………………………………..112
6-2-1- عملکرد مدل توسعه یافته در خصوص تمامی کاربران……………………….112
6-2-2- عملکرد مدل توسعه یافته در خصوص کاربران تازه وارد……………………114
6-3- نتیجه گیری نهایی ……………………………………………………………………115
6-3-1- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده epinions………..
6-3-2- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده movielens……..
6-4- پیشنهادات کارهای آینده……………………………………………………118
اختصارات……………………………………………………………………………………….120
فهرست منابع………………………………………………………………………………..121
چکیده:
امروزه با گسترش و رشد روز افزون اطلاعات در فضای مجازی و وجود انبوهی از کالا یا خدماتی که در وب سایتهای تجاری و خدماتی ارائه میگردند کاربران را با این مشکل مواجه نموده است که چگونه کالا یا خدمت مورد نظر خود را به راحتی و با صرف کمترین زمان ممکن بیابند. در این میان سیستمهای توصیهگر با هدف تسهیل و یاری رساندن به کاربران در زمینه انتخاب و یافتن کالای مورد نیاز ایشان با بهره گرفتن از علوم و روش های مبتنی بر داده کاوی اطلاعات، ایجاد و توسعه یافتهاند. همچنین در سالهای اخیر ظهور و گسترش شبکه های اجتماعی و شبکه های مبتنی بر رابطه اعتماد میان کاربران، باعث گشوده شدن افق جدیدی در ارائه سیستمهای توصیهگر و توسعه نسل جدیدی از اینگونه سیستمها گردیده است و آنرا به یکی از موضوعات جذاب و مورد توجه محققان تبدیل نموده است.
از میان روشها و مدلهای موجود در زمینه سیستمهای توصیهگر روش پالایش گروهی به لحاظ سادگی پیادهسازی از محبوبیت قابل ملاحظهای برخوردار است اما این روش در ارائه پیشنهادات مناسب و قابل قبول به کاربران تازه وارد دارای ضعفهای جدی میباشد. سیستمهای توصیهگر مبتنی بر اعتماد، با بهره گیری از رابطه اعتماد میان کاربران، در جهت رفع نقاط ضعف بیان شده و خصوصا ارائه پیشنهادات مناسب به کاربران تازه وارد گامهای موثری برداشته اند. در این تحقیق سعی شده است تا از تلفیق و ترکیب روشهای موجود در زمینه پالایش گروهی و همچنین مدلهای مبتنی بر اعتماد و بررسی نقاط ضعف و قوت آنها مدلی نوین و توسعه یافته ارائه گردد که در آن نتایج از خطای کمتر و دقت بالاتری برخوردار بوده و با افزایش معیار پوشش بتوان به درصد بیشتری از کاربران پاسخ مناسب ارائه نمود. برای این منظور در میان انواع روش های پالایش گروهی، روش مبتنی بر آیتم و برای پیمایش شبکه اعتماد میان کاربران نیز از روش پیمایش تصادفی بهره گرفته شده است، همچنین با تفسیر و تعدیل نظرات کاربران و اتخاذ شیوهای مناسب جهت محاسبه مقدار دقیق اعتماد میان کاربران و تغییر در نحوه پیمایش شبکه اعتماد میان ایشان سعی در بهبود و کاهش خطاهای نتایج گردیده است. در نهایت، جهت ارزیابی و برآورد مدل ترکیبی ارائه شده، نتایج و آمارهای حاصل از اجرای مدل پیشنهادی بر روی مجموعه داده های Epinions و Movielens و مقایسه آنها با نتایج مدل پایه TrustWalkerبه عنوان یکی از بهترین مدلهای ترکیبی ارائه شده در زمینه سیستمهای توصیه گر مبتنی بر اعتماد، ارائه میگردد.
فصل اول: مقدمه ای بر انواع سیستم های توصیه گر
1-1- مقدمه
گسترش سریع و روز افزون اطلاعات ارائه شده بر روی شبکه جهانی اینترنت، کاربران را با مشکلات عدیده و قابل تاملی در خصوص انتخاب منابع و اطلاعات مورد نیاز ایشان مواجه نموده است و چه بسا که بدون راهنمایی و هدایت صحیح، کاربران در اخذ تصمیمات صحیح یا انتخاب کالا و خدمات مورد نیازشان دچار اشتباه شده که این امر تبعات عدیدهای از جمله نارضایتی، سلب اطمینان کاربران و مشتریان سایتهای موجود بر روی اینترنت را به همراه خواهد داشت. از اینرو وجود ابزار و سیستمهایی برای کمک به کاربران در انتخاب اطلاعات مناسب و مورد نیاز ایشان کاملا ضروری به نظر میرسد. در سالهای اخیر برای برآورده سازی این نیازها سیستمهای توصیهگرمطرح و توسعه یافتهاند و الگوریتمها ، مقالات و متون علمی بسیار متنوع و مختلفی در این زمینه مطرح گردیده است .
در این میان، ایجاد و گسترش شبکه های اجتماعی، شبکه های اعتماد و وجود انواع روابط میان کاربران این شبکهها افق جدیدی را برروی محققان و توسعه دهندگان سیستمهای توصیهگر گشوده است تا با بهره گیری از علوم اجتماعی و علوم روان شناختی حاکم در این شبکهها و خصوصا وجود رابطه اعتماد میان کاربران بتوانند نسل جدیدی از سیستمهای توصیهگر را تحت عنوان “سیستمهای توصیهگر مبتنی بر اعتماد[1]”معرفی و عرضه نمایند. این سیستمها قادر هستند تا به درصد بیشتری از کاربران پاسخ مناسب را ارائه دهند و همچنین نتایج آنها از دقت بالاتری برخوردار میباشد.
با توجه به کثرت کاربران و افراد عضو شبکه های مبتنی بر اعتماد و شبکه های اجتماعی، همچنین تنوع رفتار و ویژگیهای ایشان، تنها یک شیوه یا یک مدل قادر به پاسخگویی و ارائه پیشنهادات دقیق و قابل قبول نمیباشد که این امر باعث ظهور سیستمهای توصیهگر ترکیبی[2]گردیده است. در این سیستمها سعی شده است تا با ترکیب انواع مختلفی از سیستمهای توصیهگر بتوان سیستمی تولید نمود که دارای مزایای حداکثری و معایب حداقلی باشد.
در این پایان نامه سعی شده است تا با تغییر، اصلاح، تلفیق و ترکیب تعدادی از روشها و الگوریتمهای مطرح و قابل قبول در سطح جهانی، مدلی ارائه گردد که نسبت به مدلهای پیشین دارای دقت و درصد پوشش بالاتری باشد و همچنین بتواند نقایص مدلهای پیشین خصوصا در رابطه با ارائه پیشنهاد به کاربران تازه وارد[3] را تا حد قابل قبولی مرتفع نماید.
1-2- سیستمهای توصیه گر
تعاریف متفاوتی برای سیستمهای توصیهگر ارائه شدهاست. عدهای از محققان سیستمهای توصیهگر را زیرمجموعهای از سیستمهای تصمیمیار[4] میدانند و آنها را
این مطلب را هم بخوانید :
سیستمهای اطلاعاتی[5] تعریف میکنند که توانایی تحلیل رفتارهای گذشته و ارائه توصیههایی برای مسائل جاری را دارا میباشند[1]. به زبان سادهتر در سیستمهای توصیهگر تلاش بر این است تا با حدس زدن شیوه تفکر کاربر به کمک اطلاعاتی که از نحوه رفتار وی یا کاربران مشابه و نظرات آنها داریم مناسبترین و نزدیکترین کالا یا خدمت به سلیقه او را شناسایی و پیشنهاد کنیم. این سیستمها در حقیقت سعی دارند فرایندی را که ما در زندگی روزمره خود بکار میبریم و طی آن تلاش میکنیم تا افرادی با سلایق نزدیک به خود را پیدا کرده و از آنها در مورد انتخابهایمان نظر بخواهیم را شبیه سازی نمایند.
به صورت کلیتر سیستمهای توصیهگر زیر مجموعه ای از سیستمهای پالایش اطلاعات[6]هستند که وظیفه آنها جستجو برای بیان پیش بینی امتیاز(درجه)[7] یا بیان سلایق و ترجیحات[8] یک کاربر در خصوص یک موضوع[9] ( مانند موسیقی، کتاب یا فیلم) یا یک عنصر اجتماعی مانند افراد و گروه ها میباشد[2]–[4].
1-3- انواع سیستمهای توصیه گر از لحاظ عملکردی
سیستمهای توصیهگر به لحاظ نحوه ارائه نتایج و پیشنهادات به کاربران خود، به شیوه های متفاوتی عمل می نمایند که در ذیل به پاره ای از آنها به صورت فهرست وار اشاره میگردد:
– پیشنهاد لیستی متشکل از n کالا یا محصول برتر (معمولا n برابر 10 است )
– پیشنهادات فصلی و موردی مانند پیشنهاد یک هتل دارای تخفیف جهت تعطیلات
– بیان درصد علاقهمندی سایر کاربران به یک محصول خاص، به عنوان مثال: “80 درصد کاربران از خرید این محصول راضی بوده اند ”
– پیش بینی میزان امتیازی که یک کاربر به یک محصول خاص خواهد داد
در این تحقیق سعی در ایجاد مدلی است که بتواند نظر و امتیاز تخصیص داده شده توسط یک کاربر خاص به یک محصول یا آیتم خاص را پیش بینی نماید.