HW2.pdf

‫بسمه تعالی‬
‫تمرين سري دوم – بازيابی پیشرفتهي اطالعات ‪42304‬‬
‫نیمسال اول ‪90-93‬‬
‫هذرس‪ :‬سلیواًی‬
‫هَعذ تحَيل‪ 15 :‬دی‬
‫لطفاً تِ هَارد زير در تْیِ ٍ تحَيل توريي دقت ًوايیذ‪:‬‬
‫‪-‬‬
‫چٌاىچِ سَالی در راتطِ تا ايي توريي داضتیذ تِ آدرس ‪ [email protected]‬ايویل تسًیذ‪.‬‬
‫‪-‬‬
‫تِ تورييّايی کِ تا تاخیر تحَيل دادُ ضًَذ‪ً ،‬ورُای تعلق ًویگیرد‪.‬‬
‫‪-‬‬
‫تا تورييّای کپی تِ ضذت ترخَرد خَاّذ ضذ‪.‬‬
‫‪ -1‬پرسواى‬
‫ٍ هجوَعِای از ‪ 022‬سٌذ را در ًظر تگیريذ‪ .‬جذاٍل زير تِ ازای ٍجَد ٍ عذم ٍجَد ّر ٍاشُ (هَجَد در ٍاشًُاهِ)‬
‫تعذاد اسٌاد هرتثظ ٍ ًاهرتثظ تا ايي پرسواى را ًطاى هیدّذ‪ .‬در ايي سَال تٌْا کل ٍاشُّا ‪ M=4‬در ًظر گرفتِ ضذُ است‪.‬‬
‫هیخَاّین از رٍش احتوالی ‪ BIM‬ترای اهتیازدّی ٍ رتثِتٌذی استفادُ کٌین‪.‬‬
‫‪Total‬‬
‫‪60‬‬
‫‪140‬‬
‫‪200‬‬
‫‪ً 5( .a‬ورُ) سٌذ‬
‫تا تردار‬
‫‪i=1,…,4 Relevant‬‬
‫‪x(i)=1‬‬
‫‪10i‬‬
‫‪x(i)=0‬‬
‫‪60-10i‬‬
‫‪60‬‬
‫‪Non-Relevant‬‬
‫‪60-10i‬‬
‫‪80+10i‬‬
‫‪140‬‬
‫ترای پرسواى ضاهل ٍاشُّای اٍل ٍ چْارم چِ اهتیازی خَاّذ گرفت؟‬
‫‪ً 5( .b‬ورُ) ترای پرسواًی کِ ٍاشُ اٍل ٍ چْارم را ضاهل هیضَد ترتیة هرتةسازی اسٌاد در کل چگًَِ خَاّذ تَد؟‬
‫‪ -0‬ترای تازياتی احتوالی تا استفادُ از هذل زتاًی تکگرم (‪:)unigram‬‬
‫‪.a‬‬
‫(‪ً 0‬ورُ) عثارت زير احتوال چِ چیسی را از ديذ کارتر ًطاى هی دّذ؟‬
‫) | (‬
‫∏‬
‫) | (‬
‫‪ً 7( .b‬ورُ) ًطاى دّیذ کِ استفادُ از هذل ّوَار ضذُ زير ترای احتوال رخذاد ٍاشُّا در اسٌاد ) | ( ‪:‬‬
‫)‬
‫| ( )‬
‫(‬
‫)‬
‫) | (‬
‫| (‬
‫هعادل تا تِکارگیری هعیار ضثاّت تِ صَرت زير است‪:‬‬
‫)‬
‫(‬
‫∑‬
‫)‬
‫(‬
‫بسمه تعالی‬
‫تمرين سري دوم – بازيابی پیشرفتهي اطالعات ‪42304‬‬
‫نیمسال اول ‪90-93‬‬
‫هذرس‪ :‬سلیواًی‬
‫هَعذ تحَيل‪ 15 :‬دی‬
‫کِ‬
‫سٌذ‬
‫تعذاد تکرار ٍاشُ در سٌذ ‪،‬‬
‫ٍ‬
‫تعذاد تکرار ٍاشُ در کل هجوَعِ اسٌاد‪،‬‬
‫تعذاد ‪ token‬هَجَد در‬
‫تعذاد کل ‪ token‬در هجوَعِ اسٌاد را ًطاى هیدّذ‪.‬‬
‫‪ً 5( .c‬ورُ) ارتثاط (تطاتْات ٍ تفاٍتّا) ايي هعیار ضثاّت را تا هعیار ‪ tf-idf‬هطخص کٌیذ‪.‬‬
‫‪ً 6( .d‬ورُ) ترای پاراهتر ‪ ،‬هطخص کٌیذ کِ در ّر دٍ حالت حذی (ًسديک صفر ٍ ًسديک يک) تازياتی احتوالی تا‬
‫استفادُ از هذل زتاًی تکگرم چِ تعثیری دارد ٍ ترای چِ پرسواىّايی هٌاسةتر است؟‬
‫‪ -3‬هجوَعِی دادُّای زير را در يک فضای دٍتعذی ترای دٍ کالس ‪ 0 ٍ1‬در ًظر تگیريذ‪:‬‬
‫کالس ‪)1,0( ،)0,1( ،)0,2( ،)2,0( :1‬‬
‫کالس ‪)3,3( ،)3,6( ،)5,3( ،)3,3( ،)3,3( :0‬‬
‫‪ً 5( .a‬ورُ) اگر از دستِتٌذ ‪ ٍ ROCCHINO‬ضثاّت کسیٌَسی ترای دستِتٌذی استفادُ کٌین‪ً ،‬قطِی (‪ )3,0‬در فضا‬
‫تِ کذام دستِ تعلق هیگیرد؟‬
‫‪ً 5( .b‬ورُ) ضوي رسن ًقاط در فضا‪ ،‬هعیي کٌیذ کِ دستِتٌذ ‪ً 3-NN‬قطِی (‪ )3,0‬را تِ کذام دستِ اًتساب هیدّذ‪.‬‬
‫‪ -3‬ترای خَضِتٌذی هجوَعِ دادُی هَجَد در ضکل زير را در ًظر تگیريذ‪:‬‬
‫‪ً 5( .a‬ورُ) ًحَُ خَضِتٌذی ‪ k-means‬در حالتیکِ‬
‫ٍ هراکس دٍ خَضِ در ضرٍع کار دادُّای هطخص ضذُ‬
‫تِ رًگ قرهس تاضٌذ را تعییي کٌیذ‪.‬‬
‫‪ً 12( .b‬ورُ) ًتايج دستِتٌذی تِ دٍ خَضِ تَسظ الگَريتنّای سلسلِهراتثی ‪ complete-link ٍ single-link‬رٍی‬
‫هجوَعِ دادُی تاال را هطخص ًوايیذ‪.‬‬
‫‪ -5‬هاتريس‬
‫ترای ًوايص رخذاد ٍاشُّا در اسٌاد تِ صَرت زير را در ًظر تگیريذ‪:‬‬
‫بسمه تعالی‬
‫تمرين سري دوم – بازيابی پیشرفتهي اطالعات ‪42304‬‬
‫نیمسال اول ‪90-93‬‬
‫هذرس‪ :‬سلیواًی‬
‫هَعذ تحَيل‪ 15 :‬دی‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪Solid‬‬
‫‪Computer‬‬
‫‪Science‬‬
‫‪Information‬‬
‫‪Technology‬‬
‫‪Mechanics‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫چٌاىچِ حاصل اعوال ‪ SVD‬رٍی هاتريس ‪ C‬تِ ترتیة هاتريسّای ‪ Σ ٍ V ،U‬زير تاضذ‪:‬‬
‫‪0.08‬‬
‫‪0.69‬‬
‫‪-0.60‬‬
‫‪-0.24‬‬
‫‪-0.32‬‬
‫‪0.08‬‬
‫‪-0.71‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0.71‬‬
‫‪-0.26‬‬
‫‪-0.06‬‬
‫‪-0.61‬‬
‫‪0.35‬‬
‫‪0.61‬‬
‫‪-0.26‬‬
‫‪0.15‬‬
‫‪-0.21‬‬
‫‪-0.21‬‬
‫‪0.75‬‬
‫‪-0.54‬‬
‫‪0.15‬‬
‫‪-0.15‬‬
‫‪-0.66‬‬
‫‪-0.42‬‬
‫‪-0.48‬‬
‫‪-0.34‬‬
‫‪-0.15‬‬
‫‪-0.62‬‬
‫‪0.22‬‬
‫‪0.22‬‬
‫‪0.12‬‬
‫‪-0.35‬‬
‫‪-0.62‬‬
‫‪0.29‬‬
‫‪0.40‬‬
‫‪-0.48‬‬
‫‪0.53‬‬
‫‪-0.50‬‬
‫‪-0.64‬‬
‫‪0‬‬
‫‪0.50‬‬
‫‪0.46‬‬
‫‪-0.36‬‬
‫‪-0.53‬‬
‫‪0.7‬‬
‫‪-0.25‬‬
‫‪-0.40‬‬
‫‪0.07‬‬
‫‪0.21‬‬
‫‪0‬‬
‫‪0.27‬‬
‫‪-0.58‬‬
‫‪-0.74‬‬
‫‪-0.43‬‬
‫‪-0.59‬‬
‫‪-0.62‬‬
‫‪-0.12‬‬
‫‪-0.25‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0.31‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0.66‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1.28‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪2.14‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪2.50‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪ً 5( .a‬ورُ) اسٌاد را در فضای دٍ تعذی حاصل از اعوال ‪ً LSI‬وايص دّیذ‪.‬‬
‫‪ً 5( .b‬ورُ) هاتريس‬
‫تا رتثِ (‪ 0 )rank‬کِ رخذاد ٍاشُّا در اسٌاد را در فضای دٍ تعذی حاصل از اعوال ‪ً LSI‬طاى‬
‫هیدّذ‪ ،‬را در ًظر تگیريذ‪ .‬هقادير‬
‫‪،‬‬
‫‪،‬‬
‫را هحاسثِ کردُ ٍ در هَرد هقادير حاصل تحث‬
‫کٌیذ‪.‬‬
‫‪ً 5( .c‬ورُ) هحل پرسواى ‪ Information Technology‬را در فضای تثذيل يافتِ هطخص کٌیذ ٍ اسٌاد را تر حسة‬
‫ضثاّت کسیٌَسی تا پرسواى (در ايي فضا) هرتة کٌیذ‪.‬‬
‫بسمه تعالی‬
‫تمرين سري دوم – بازيابی پیشرفتهي اطالعات ‪42304‬‬
‫نیمسال اول ‪90-93‬‬
‫هذرس‪ :‬سلیواًی‬
‫هَعذ تحَيل‪ 15 :‬دی‬
‫‪ -6‬تحلیل پیًَذّا‬
‫‪ .1.6‬هجوَعِ صفحات ٍب زير را در ًظر تگیريذ‪:‬‬
‫‪ً 12( .i‬ورُ) چٌاىچِ از دٍرتری (‪ )teleporting‬تا‬
‫‪ α‬استفادُ ضَد‪ ،‬تِ عثارت ديگر در صفحِّايی‬
‫کِ لیٌک خرٍجی دارًذ‪ ،‬احتوال ‪ α‬ترای پرش تصادفی تِ يکی از کل صفحات در ًظر گرفتِ ضَد ٍ در‬
‫صفحات تذٍى لیٌک خرٍجی احتوال پرش تِ يک صفحِی تصادفی يک در ًظر گرفتِ هیضَد‪ ،‬هاتريس‬
‫اًتقال احتوالی تیي صفحات را پیذا کٌیذ ٍ هقذار ‪ PageRank‬صفحات را تا استفادُ از ايي هاتريس تِ‬
‫دست آٍريذ‪.‬‬
‫‪ً 12( .ii‬ورُ) هقادير ‪ authority ٍ hub‬صفحات را تا استفادُ از رٍش ‪ HITS‬تِ دست آٍريذ ‪.‬فرض کٌیذ در‬
‫ّر ‪ iteration‬هقادير ‪ )authority( hub‬تر تیطیٌِ هقادير ‪ )authority( hub‬تقسین ضَد‪.‬‬
‫𝑑‬
‫𝑑‬
‫𝑑‬
‫𝑑‬
‫𝑑‬
‫‪ً 5( .0.6‬ورُ) ًطاى دّیذ در حالت کلی ٍ در صَرت استفادُ از دٍرتری (‪ )teleporting‬تا احتوال ‪ ،α‬هقذار‬
‫ّوِی صفحات حذاقل‬
‫‪ً 5( .3.6‬ورُ) اگر‬
‫‪PageRank‬‬
‫‪ α‬است ( تعذاد کل صفحات)‪.‬‬
‫هاتريس هجاٍرت يک گراف تاضذ‪ ،‬درايِّای سطر ‪-‬ام‪ ،‬ستَى ‪-‬ام هاتريسّای‬
‫ٍ‬
‫تعاتیری دارد؟‬
‫هَفق تاضیذ‬
‫چِ‬