Homework 3 (Updated)

‫به نام خدا‬
‫فبس‪ 2‬پزٍصُ ٍ توزیي تئَری ؽوبرُ‪ 3‬درط یبدگیزی هبؽیي‬
‫عیبعت ًوزُ ‪ :‬ثِ اسای ّز رٍس تبخیز ‪ %8‬اس ًوزُ کبّؼ خَاّذ یبفت‪.‬‬
‫تبریخ ثبرگذاری‪:‬‬
‫‪1321/08/22‬‬
‫توزیي ّبی تئَری را ثِ صَرت دعت ًَیظ یب پزیٌت ؽذُ ثِ آسهبیؾگبُ هْلت تحَیل‪:‬‬
‫‪ 1391/09/14‬عبعت ‪ 12‬ؽت‬
‫عیغتن ّبی َّؽوٌذ (‪ )505‬تحَیل ًوبییذ‪.‬‬
‫کذّبی پیبدُ عبسی ٍ گشارػ هزثَطِ ثب فزهت ‪ PDF‬را در قبلت یک فبیل‬
‫‪ zip‬ثب ًبم ٍ عٌَاى ‪( ML91P1_StdNo‬کِ ‪ StdNo‬ؽوبرُ داًؾجَیی‬
‫ؽوبعت) ثِ ایویل ‪ [email protected]‬ارعبل ًوبییذ‪.‬‬
‫توزیي ّبی تئَری‬
‫‪ .1‬جذٍل سیز هزثَط ثِ ٍجَد یب عذم ٍجَد ًقص فٌی در ‪ً 11‬وًَِ اس خَدرٍ ّبی تَلیذ ؽذُ تَعط یک کوپبًی هی ثبؽذ‪.‬‬
‫رًگ‬
‫ًَع‬
‫عبل تَلیذ‬
‫ًقص فٌی‬
‫‪1‬‬
‫قزهش‬
‫‪Sport‬‬
‫‪2011‬‬
‫دارد‬
‫‪2‬‬
‫قزهش‬
‫‪Sport‬‬
‫‪2011‬‬
‫ًذارد‬
‫‪3‬‬
‫قزهش‬
‫‪Sport‬‬
‫‪2011‬‬
‫دارد‬
‫‪4‬‬
‫سرد‬
‫‪Sport‬‬
‫‪2011‬‬
‫ًذارد‬
‫‪5‬‬
‫سرد‬
‫‪Sport‬‬
‫‪2012‬‬
‫دارد‬
‫‪6‬‬
‫سرد‬
‫‪SUV‬‬
‫‪2012‬‬
‫ًذارد‬
‫‪7‬‬
‫سرد‬
‫‪SUV‬‬
‫‪2012‬‬
‫دارد‬
‫‪8‬‬
‫سرد‬
‫‪SUV‬‬
‫‪2011‬‬
‫ًذارد‬
‫‪9‬‬
‫قزهش‬
‫‪SUV‬‬
‫‪2012‬‬
‫ًذارد‬
‫‪10‬‬
‫قزهش‬
‫‪Sport‬‬
‫‪2012‬‬
‫دارد‬
‫ثب اعتفبدُ اس الگَریتن ‪ٍ naïve bayes‬جَد یب عذم ٍجَد ًقص فٌی در یک ًوًَِ جذیذ اس خَدرٍی ‪ SUV‬قزهش رًگ هذل ‪ 2011‬را‬
‫پیؾجیٌی کٌیذ‪.‬‬
‫‪ .2‬در یک هغبلِ ی دعتِ ثٌذی ‪ 2‬کالعِ‪ً ،‬وًَِ ّب دارای یک ٍیضگی )]‪ّ (xϵ[0,1‬غتٌذ‪ّ .‬وچٌیي هی داًین کِ چگبلی احتوبالتی‬
‫ؽزطی ) ‪ x (Conditional probability density function‬ثِ ؽکل سیز اعت‪.‬‬
‫) | (‬
‫‪|Page1‬‬
‫) | (‬
‫ثب فزض ایٌکِ احتوبل تعلق ًوًَِ ّبی جذیذ ثِ کالط ‪ 1‬ثزاثز ‪ 0225‬ثبؽذ‪ ،‬قبعذُ ای ثزای تؾخیص کالط ّز ًوًَِ جذیذ ثز اعبط‬
‫هقبدیز ‪ x‬تعییي کٌیذ کِ کوتزیي خطب را داؽتِ ثبؽذ‪.‬‬
‫(راٌّوبیی‪ :‬اس رٍاثط ثیش اعتفبدُ کٌیذ)‬
‫‪ .3‬توزیي ّبی ‪ً ( 4 ٍ 2‬یبسی ثِ ارائِ راُ حل ثذٍى اعتفبدُ اس ‪ً VC dimension‬یغت ) ٍ ‪ 5‬اس فصل ‪ 7‬کتبة هیؾل‬
‫توزیي ّبی پیبدُ عبسی ( فبس ‪ 2‬پزٍصُ)‬
‫ّذف اس ایي فبس آؽٌبیی ثب یبدگیزّبی گزٍّی ٍ ثیش هی ثبؽذ‪.‬‬
‫هجوَعِ دادُ هَرد اعتفبدُ در ایي فبس ‪ churn‬هی ثبؽذ کِ در فبس قجل ّن هَرد اعتفبدُ قزار گزفتِ ثَد‪.‬‬
‫هجوَعِ دادُ ثب فزهت ‪( ARFF‬فزهت قبثل اعتفبدُ در‪ (WEKA‬در عبیت ثبرگذاری ؽذُ اعت‪.‬‬
‫‪ .1‬الگَریتن ‪ AdaBoost‬را ثب اعتفبدُ اس دعتِ ثٌذ پبیِ ‪ naïve bayes‬پیبدُ عبسی کٌیذ ٍ ثبسُ خطبی ٍاقعی ‪10-fold‬‬
‫‪ cross validation‬را ثزای ‪ %55‬اطویٌبى هحبعجِ ًوبییذ‪ naïve bayes ٍ AdaBoost( .‬ثبیذ تَعط ؽوب پیبدُ‬
‫عبسی ؽَد ٍ اعتفبدُ اس اثشارّبی آهبدُ هجبس ًیغت)‬
‫‪ .2‬الگَریتن ‪ AdaBoost‬پیبدُ عبسی ؽذُ در هزحلِ قجل را ثب دعتِ ثٌذ پبیِ ‪ K-NN‬کِ در فبس قجل پیبدُ عبسی کزدیذ اجزا‬
‫کٌیذ ٍ ثبسُ خطبی ٍاقعی ‪ 10-fold cross validation‬را ثزای ‪ %55‬اطویٌبى هحبعجِ ًوبییذ‪.‬‬
‫‪ .3‬کذام رٍػ ثزای ایي هجوَعِ دادُ هٌبعت تز اعت؟ ( ثب اعتفبدُ اس آسهَى ‪( Paired t-test‬اعتفبدُ اس ‪ weka‬ثزای‬
‫اًجبم ‪ paired t-test‬هجبس ًیغت))‬
‫تَجِ ‪ :‬اعتفبدُ اس اثشارّب ٍ کتبثخبًِ ّبی آهبدُ در ّیچ کذام اس هزاحل هجبس ًیغت‪ ٍ .‬فقط هی تَاًیذ اس تَاثع ‪ weka‬ثزای‬
‫خَاًذى فبیل ٍرٍدی اعتفبدُ ًوبییذ‪.‬‬
‫‪|Page2‬‬