patternProject.pdf

‫دانشگاه صنعتی شریف‬
‫در این پروژه قصد داریم تا روشهای مختلف خوشهبندی را بر روی مجموعه دادههای مختلف بررسی کنیم‪.‬‬
‫مجموعهدادهها‬
‫برای ارزیابی عملکرد روشهای خوشهبندی مختلف از مجموعهدادههای مشخص شده در تصویر یک استفاده کنید‪ .‬این دادهها‬
‫پراکندگیهای مختلفی دارند و میتوانند عملکرد هر کدام از روشها را در شرایط مختلف مورد ارزیابی قرار دهند‪.‬‬
‫تصویر ‪ :1‬مجموعهدادههای مختلف‬
‫‪1‬‬
‫آزمایشگاه رسانهای دیجیتال‬
‫ا‬
‫پروژه درس الگوشناسی آماری‬
‫آزمایشگاه رسانههای دیجیتال‬
‫روشهای خوشهبندی‬
‫روشهای ‪ Complete & Single link ،GMM ،K-means‬و )‪ Spectral(Ncut‬را پیادهسازی نمایید و نتایج حاصل را بر اساس معیارهای‬
‫‪ Davies–Bouldin index‬و ‪ [Dav97, Dun73] Dunn index‬تحلیل کنید‪.‬‬
‫الگوریتم خوشهبندی ‪ K-means‬را به گونهای تغییر دهید که بر اساس ‪ Kernel‬بیان شود‪ ،‬ضمن ارائه شرح مختصر از روش کار‪ ،‬آن را‬
‫پیادهسازی نمایید و نتایج آن را تحلیل کنید‪ ،‬برای این منظور میتوانید به ]‪ [Gri02‬مراجع کنید‪ .‬اگر از کرنل گوسی در الگوریتم ارائه‬
‫شده استفاده کنیم‪ ،‬مقادیر مختلف پارامتر گوسی چه تاثیری روی عملکرد روش دارد؟‬
‫شباهت و تفاوت روش ‪ K-means‬مبتنی بر ‪ Kernel‬با روشهای طیفی در چیست؟ برای پاسخ به این سوال میتوانید به ]‪ [Dhi04‬مراجع‬
‫کنید‪.‬‬
‫به نظر شما استفاده از روشهای کاهش بعد برای خوشهبندی دادهها مفید است؟‬
‫گزارش پروژه‬
‫گزارشی شامل شرح فعالیتهای انجام شده‪ ،‬تحلیل نتایج و جمعبندی ارائه نمایید‪ .‬مجموعه کامل کدها (همراه با کامنت)‪ ،‬شامل یک فایل‬
‫اجرایی اصلی به نام ‪ main‬که تمام نتایج را به صورت نمودار‪ ،‬جدول و خروجی گرافیکی از خوشهها مشخص میکند‪.‬‬
‫مراجع‬
‫‪[Gri02] Girolami, Mark. "Mercer kernel-based clustering in feature space." Neural Networks, IEEE Transactions on 13,‬‬
‫‪no. 3 (2002): 780-784.‬‬
‫‪[Dav97] Davies, David L., and Donald W. Bouldin. "A cluster separation measure." Pattern Analysis and Machine‬‬
‫‪Intelligence, IEEE Transactions on 2 (1979): 224-227.‬‬
‫‪[Dun73] Dunn, Joseph C. "A fuzzy relative of the ISODATA process and its use in detecting compact well‬‬‫‪separated clusters." (1973): 32-57.‬‬
‫‪[Dhi04] Dhillon, Inderjit S., Yuqiang Guan, and Brian Kulis. "Kernel k-means: spectral clustering and normalized‬‬
‫‪cuts." In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 551-556.‬‬
‫‪ACM, 2004.‬‬
‫‪2‬‬
‫آزمایشگاه رسانهای دیجیتال‬
‫ا‬