2-10-4- گریشیپ…………………………………………………………………………………………………………………33
2-11- بررسی چگونگی کارکرد سایت آمازون…………………………………………………………………………33
فصل 3 : روش محتوا محور………………………………………………………………………………………………………36
3-1- پیشگفتار………………………………………………………………………………………………………………………….37
3-2- روند کار روش محتوا محور……………………………………………………………………………………………..37
3-2-1- تحلیلگر محتوا…………………………………………………………………………………………………………..38
3-2-2- یادگیرنده نمایه …………………………………………………………………………………………………..39
3-2-3- جزء فیلترینگ…………………………………………………………………………………………………………….42
3-3- مزایای روش محتوا محور………………………………………………………………………………………………..42
3-3-1- استقلال کاربر……………………………………………………………………………………………………………..42
3-3-2- شفافیت……………………………………………………………………………………………………………………….42
3-3-3- قلم جدید…………………………………………………………………………………………………………………….43
3-4- معایب روش محتوا محور…………………………………………………………………………………………………43
3-4-1- کمبود محتوا……………………………………………………………………………………………………………….43
3-4-2- خصوصی سازی افزون…………………………………………………………………………………………………43
3-4-3- کاربر جدید………………………………………………………………………………………………………………….44
فصل 4 : روش پیشنهادی………………………………………………………………………………………………………….45
4-1- پیشگفتار………………………………………………………………………………………………………………………….46
4-2- مروری بر کارهای انجام شده در این راستا……………………………………………………………………..46
4-3- مقدمهای بر روش پیشنهادی…………………………………………………………………………………………..48
4-4- روش پیشنهادی………………………………………………………………………………………………………………48
4-4-1- پیش پردازش………………………………………………………………………………………………………………49
4-4-1-1- پیش پردازش بر روی پایگاه داده MovieLens………………………………………………………………….
4-4-1-2- پیش پردازش بر روی پایگاه داده EachMovie………………………………………………………………..
4-4-2- وزندهی به اقلام…………………………………………………………………………………………………………51
4-4-3- انتخابهمسایگی…………………………………………………………………………………………………………53
4-4-4- پیشبینی……………………………………………………………………………………………………………………54
فصل 5 : آزمایشها و نتایج……………………………………………………………………………………………………….56
5-1- پایگاه داده های مورد استفاده…………………………………………………………………………………………..57
5-2- نحوه اجرای روش پیشنهادی روی پایگاه داده MovieLens……………………………………………………..
5-3- نحوه اجرای روش پیشنهادی روی پایگاه داده ٍEachMovie……………………………………………………
5-4- معیارهایارزیابی………………………………………………………………………………………………………………58
5-4-1- میانگین خطای مطلق…………………………………………………………………………………………………58
5-4-2- دقت و فراخوانی………………………………………………………………………………………………………….59
5-4-3- معیار ارزیابیF1…………………………………………………………………………………………………………60
5-5- ارزیابی روش پیشنهادی توسط معیارهای معرفی شده…………………………………………………..61
فصل 6 : بحث و نتیجه گیری…………………………………………………………………………………………………….66
6-1- بحث…………………………………………………………………………………………………………………………………67
6-2- نتیجهگیری……………………………………………………………………………………………………………………..67
6-4- پیشنهادات……………………………………………………………………………………………………………………….68
مراجع………………………………………………………………………………………………………………………………..69
چکیده:
سیستمهای پیشنهادگر ابزارهای نرم افزاری و تکنیکهایی هستند که اقلام را مطابق با نیاز کاربر به او معرفی می کنند. روشهای محتوا محور و فیلترینگ اشتراکی از راهکارهای موفق در سیستمهای پیشنهادگر میباشند. روش محتوا محور بر اساس ویژگیهای اقلام تعریف میشود. این روش بررسی می کند که اقلام مورد علاقه کاربر دارای چه ویژگیهایی بوده اند، سپس اقلام دارای ویژگیهای مشابه را به او پیشنهاد می کند. روش فیلترینگ اشتراکی بر اساس تعیین اقلام مشابه یا کاربران مشابه کار می کند که به ترتیب فیلترینگ اشتراکی مبتنی بر اقلام و مبتنی بر کاربران نامیده میشود. در این پایان نامه یک روش تلفیقی از روشهای فیلترینگ اشتراکی و محتوا محور ارائه شده است. این روش می تواند به عنوان روش فیلترینگ اشتراکی مبتنی بر کاربر در نظر گرفته شود. به این صورت که به منظور یافتن کاربرانی با سلیقه مشابه با کاربر فعال به عنوان کاربرانی با دقت پیشگویی بالا از ویژگیهای مربوط به محتوای اقلام برای افزایش تاثیر امتیازهایی که توسط کاربران به اقلام مشابه تخصیص داده شده است استفاده می کند. به بیان دیگر دو کاربر مشابه هستند در صورتی که امتیازهایی که به اقلامی که از نظر محتوا مشابه هستند نسبت دادهاند، همسان باشند. برای این منظور در هنگام سنجیدن شباهت دو کاربر، به امتیاز نسبت داده شده به هر قلم، با توجه به میزان شباهت آن به قلم هدف، وزن تخصیص می یابد.
فصل اول
1- مقدمه
1-1- پیشگفتار
پیدایش اینترنت و وب جهان گستر[1] موجب شده است که در رابطه با هر موضوع قابل تصور، حجم بسیار زیادی از اطلاعات وجود داشته باشد که کاربران[2] بتوانند با بهره گرفتن از آن نیاز اطلاعاتی خود را برطرف سازند. افزایش روز افزون اطلاعات باعث شد که مشکل سربار اطلاعات[3] به وجود آید و کاربران به تنهایی قادر به برطرف کردن نیازهای خود نباشند. . زیرا کاربران مجبور بودند به صورت بر خط[4] تمامی صفحات را جستجو کنند تا بتوانند آن قسمتی را که مورد نیازشان است پیدا کنند. به همین دلیل موتورهای جستجوگر[5] به وجود آمدند تا کاربران بتوانند با بهره گرفتن از آنها بدون نیاز به بررسی تعداد زیادی از صفحات به اطلاعات مورد نظرشان دسترسی پیدا کنند.
1-2- موتورهای جستجوگر
به عبارت دیگر یک موتور جستجوگر وب سایتی است که میتوان از آن برای پیدا کردن صفحات وب استفاده کرد. وقتی کاربر درخواست خود را در قالب کلمات
این مطلب را هم بخوانید :
کلیدی وارد موتور جستجوگر می کند موتور جستجوگر در بین بیلیونها صفحه وب جستجو کرده و به کاربر کمک می کند اطلاعاتی که به دنبال آن است را بیابد. با بهره گرفتن از این ابزار سرعت و دقت در جستجو بسیار افزایش یافت و کاربران توانستند به سادگی و در کمترین زمان به بهترین نتایج دست یابند.
انواع زیادی از موتورهای جستجوگر توسط کمپانیهای مختلف ساخته شده است که معروفترین آنها بینگ[6]، یاهو[7] و گوگل[8] میباشد (شکل شماره 1).
هر موتور جستجوگر راه و روش خود را برای سازماندهی اطلاعات دارد، پس نتیجه از یک موتور جستجوگر تا دیگری متفاوت خواهد بود.
موتورهای جستجوگر به دو دسته کلی تقسیم میشوند : موتورهای جستجوگر پیمایشی[9] و فهرستهای تکمیل دستی[10]. موتورهای جستجوگر ترکیبی[11] نیز حاصل ترکیب دو نوع بالا میباشند. گونهای جدید از موتورهای جستجوگر نیز تحت عنوان ابر جستجوگرها[12] وجود دارد که در ادامه به طور خلاصه به توضیح هر کدام از این موارد خواهیم پرداخت.
1-2-1- موتورهای جستجوگر پیمایشی
این موتورهای جستجوگر، وب را پیمایش و اطلاعاتی را ذخیره می کنند. سپس کاربران از میان این اطلاعات آنچه را که میخواهند جستجو می کنند. اگر در صفحه وب تغییراتی اعمال شود موتورهای جستجوگر پیمایشی به طور خودکار آنها را مییابند و تغییرات مذکور را در فهرستها اعمال می کنند. نمونههایی ازموتورهای جستجوگر پیمایشی گوگل و یاهو میباشند.
1-2- 2- فهرستهای تکمیل دستی
فهرستهای تکمیل دستی وابسته به کاربرانی میباشد که آن را تکمیل می کنند. یا کاربر خودش صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت می کند یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده صورت میپذیرد. در این حالت عمل جستجو تنها بر روی توضیحات ثبت شده انجام میگیرد و اگر تغییری روی صفحه وب به وجود آید در فهرست تغییر به وجود نخواهد آمد. نمونه ای از فهرستهای تکمیل دستی Open Directoryمیباشد[13].