3-2-12 انواع داده تعیین شده ………………………….33
3-2-13 عملیات انتخاب ویژگیهای موثرتر………………………….. 34
3-3 نتایج اعمال الگوریتم PCA و الگوریتم های وزن دهی………….. 34
3-4 ویژگی های منتخب جهت استفاده در الگوریتمهای حساس به تعداد ویژگی……. 36
3-5 معیارهای ارزیابی الگوریتمهای دسته بندی…………………………… 37
3-6 ماتریس درهم ریختگی…………………………… 37
3-7 معیار AUC…………………………..
3-8 روش های ارزیابی الگوریتم های دسته بندی…………………………… 39
3-8-1 روش Holdout………………………….
3-8-2 روش Random Subsampling…………………………..
3-8-3 روش Cross-Validation…………………………..
3-8-4 روش Bootstrap…………………………..
3-9 الگوریتمهای دسته بندی…………………………… 41
3-9-1 الگوریتم KNN……………………………
3-9-2 الگوریتم Naïve Bayes………………………….
3-9-3 الگوریتم Neural Network…………………………..
3-9-4 الگوریتم SVM خطی…………………………… 45
3-9-5 الگوریتم رگرسیون لجستیک…………………………… 46
3-9-6 الگوریتم Meta Decision Tree…………………………..
3-9-7 الگوریتم درخت Wj48…………………………..
3-9-8 الگوریتم درخت Random forest………………………….
3-10 معیارهای ارزیابی الگوریتم های مبتنی بر قانون(کشف قوانین انجمنی)…… 54
3-10-1 الگوریتم FPgrowth…………………………..
3-10-2 الگوریتم Weka Apriori………………………….
3-11 معیارهای ارزیابی الگوریتمهای خوشه بندی…….. 55
3-12 الگوریتم های خوشه بندی…………………………… 57
3-12-1 الگوریتم K-Means………………………….
3-12-2 الگوریتم Kohonen…………………………..
3-12-3 الگوریتم دوگامی…………………………… 64
فصل چهارم: ارزیابی و نتیجه گیری
4-1 مقایسه نتایج………………………….. 69
4-2 الگوریتمهای دسته بندی…………………………… 69
4-3 الگوریتم های دسته بندی درخت تصمیم………………………….. 70
4-4 الگوریتم های خوشه بندی…………………………… 79
4-5 الگوریتم های قواعد تلازمی(مبتنی بر قانون)…………………………. 81
4-6 پیشنهادات به شرکت های بیمه………………………….. 81
4-7 پیشنهادات جهت ادامه کار…………………………. 83
منابع و مأخذ
فهرست منابع فارسی…………………………… 84
فهرست منابع انگلیسی…………………………… 85
چکیده:
بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت های بیمه تاثیر داشته اند.
هدف این پایان نامه شناخت عوامل اثرگذار و ضریب تاثیر آنها در سود و زیان بیمه شخص ثالث خودرو شرکت های بیمه با بهره گرفتن از روش داده کاوی و سپس انتخاب الگوریتمی که بهترین میزان دقت پیش بینی برای تشخیص این عوامل را داشته اند می باشد.
نتیجه حاصل از این پژوهش نشان می دهد که روش های داده کاوی با بهره گرفتن از الگوریتم های دسته بندی با دقت بالای 91% و الگوریتم های درخت تصمیم با دقت بالای 96% و الگوریتم های خوشه بندی با ایجاد خوشه های قابل قبول قادر به ارائه مدلی برای تشخیص عوامل اثرگذار و تعیین میزان اثر آنها در سود و زیان بیمه نامه شخص ثالث خودرو خواهند بود.
فصل اول
مقدمه:
شرکتهای تجاری و بازرگانی برای ادامه بقا و حفظ بازار همواره بر سود دهی و کاهش ضرر و زیان خود تاکید دارند از این رو روش های جذب مشتری و همچنین تکنیکهای جلوگیری یا کاهش زیان در سرلوحه کاری این شرکتها قرار می گیرد.
این مطلب را هم بخوانید :
از جمله شرکتهایی که بدلایل مختلف در معرض کاهش سود و یا افزایش زیان قرار می گیرند شرکتهای بیمه ای می باشند. عواملی همچون بازاریابی، وفاداری مشتریان، نرخ حق بیمه، تبلیغات، تقلب، می تواند باعث جذب یا دفع مشتری گردد که در سود و زیان تاثیر مستقیم و غیر مستقیم دارد.
پرداخت خسارت نیز به عنوان تعهد شرکتهای بیمه منجر به کاهش سود و در بعضی موارد موجب زیان یک شرکت بیمه می شود. خسارت می تواند بدلایل مختلف رخ دهد و یا عملی دیگر به گونه ای خسارت جلوه داده شود که در واقع اینچنین نیست.
عواملی از قبیل فرهنگ رانندگی، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، جاده های بین شهری و خیابانهای داخل شهر که شهرداری ها و ادارات راه را به چالش می کشد، تقلب، وضعیت آب و هوا، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه ، روزهای تعطیل، مسافرتها و بسیاری موارد دیگر می توانند موجب خسارت و در نهایت افزایش زیان یک شرکت بیمه ای گردند.
بیمه صنعتی سودمند، ضروری و مؤثر در توسعه اقتصادی است. این صنعت بدلیل «افزایش امنیت در عرصه های مختلف زندگی و فعالیتهای اقتصادی»، «افزایش سرمایه گذاری و اشتغال و رشد اقتصادی» و « ارتقای عدالت اقتصادی و کاهش فقر ناشی از مخاطرات »، حائز جایگاه مهمی در پیشرفت و تعالی یک کشور است.
با وجود نقش مهم بیمه در بسترسازی و تأمین شرایط مساعد اقتصادی، وضعیت کنونی این صنعت در اقتصاد ملی با وضعیت مطلوب آن فاصله زیادی دارد. عدم آشنایی عمومی و کم بودن تقاضا برای محصولات بیمه ای، دانش فنی پایین در عرصه خدمات بیمه ای، عدم تطابق ریسک با حق بیمه، تفاوت فاحش در مقایسه معیارهای تشخیص ریسک بیمه شخص ثالث با نوع بیمه معادل در کشورهای توسعه یافته، وجود نارسایی ها در مدیریت واحدهای عرضه بیمه از دلایل عدم توسعه مناسب این صنعت در کشور است. از آنجا که بشر در طول تاریخ به کمک علم و تجربه رستگاری ها و توفیقات فراوانی کسب کرده است، نگاه علمی تر به مشکلات این صنعت و یافتن راه حل در بستر علم می تواند راه گشا باشد.
امروزه بوسیله روش های داده کاوی ارتباط بین فاکتورهای مختلف موثر یا غیر موثر در یک موضوع مشخص می شود و با توجه به اینکه داده کاوی ابزاری مفید در استخراج دانش از داده های انبوه می باشد که