SPR-Spring2014-HW6.pdf

‫ﺑﺴﻤﻪ ﺗﻌﺎﻟﯽ‬
‫ﺍﻟﮕﻮﺷﻨﺎﺳﯽ ﺁﻣﺎﺭﯼ‬
‫ﻧﯿﻢﺳﺎﻝ ﺩﻭﻡ ‪۹۲-۹۳‬‬
‫ﺩﮐﺘﺮ ﺭﺑﯿﻌﯽ‬
‫ﺩﺍﻧﺸﮑﺪﻩ ﻣﻬﻨﺪﺳﯽ ﮐﺎﻣﭙﯿﻮﺗﺮ‬
‫ﺗﻤﺮ ﯾﻦ ﺷﺸﻢ‬
‫ﺯﻣﺎﻥ ﺗﺤﻮﯾﻞ‪ :‬ﺩﻭ ﻫﻔﺘﻪ ﺑﻌﺪ ﺍﺯ ﺯﻣﺎﻥ ﺍﻧﺘﺸﺎﺭ‬
‫ﺧﻮﺷﻪﺑﻨﺪﯼ ﺩﺍﺩﻩﻫﺎ‬
‫‪ .۱‬ﺩﺍﺩﻩﻫﺎﯼ ﺯﯾﺮ ﺭﺍ ﺑﺎ ﺭ ﻭﺵ ‪ Single link‬ﻭ ‪ Complete link‬ﺧﻮﺷﻪﺑﻨﺪﯼ ﮐﻨﯿﺪ ﻭ ﺳﭙﺲ ﻧﻤﻮﺩﺍﺭ ‪ dendrogram‬ﻣﺮﺑﻮﻁ‬
‫ﺑﻪ ﻫﺮ ﮐﺪﺍﻡ ﺭﺍ ﺭﺳﻢ ﮐﻨﯿﺪ‪.‬‬
‫ﺩﺍﺩﻩﻫﺎ ‪۲،۱،۳،۰،۰/۱،۰/۳،۵،۶،۵/۳ :‬‬
‫‪ .۲‬ﻧﺘﯿﺠﻪ ﺍﻋﻤﺎﻝ ﺍﻟﮕﻮﺭﯾﺘﻢﻫﺎﯼ ﺧﻮﺷﻪﺑﻨﺪﯼ ﻣﺨﺘﻠﻒ ‪ K-means, GMM, Single link, Complete link‬ﺑﺮ ﺭ ﻭﯼ ﺩﻭ‬
‫ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩﯼ ﻧﺸﺎﻥ ﺩﺍﺩﻩ ﺷﺪﻩ ﺩﺭ ﺗﺼﻮﯾﺮ ‪ ۱‬ﺭﺍ ﺗﺤﻠﯿﻞ ﮐﻨﯿﺪ‪.‬‬
‫ﺷﮑﻞ ‪ :۱‬ﻣﺠﻤﻮﻋﻪ ﺩﺍﺩﻩﻫﺎ‬
‫‪ .۳‬ﺑﺮﺍﯼ ﺍﻟﮕﻮﺭﯾﺘﻢ ﺧﻮﺷﻪﺑﻨﺪﯼ ‪ K-means‬ﺑﻪ ﺳﻮﺍﻻﺕ ﺯﯾﺮ ﭘﺎﺳﺦ ﺩﻫﯿﺪ‪:‬‬
‫)ﺁ( ﺗﺎﺛﯿﺮ ﺍﻓﺰﺍﯾﺶ ﺗﻌﺪﺍﺩ ﺧﻮﺷﻪﻫﺎ ﺑﺮ ﺭ ﻭﯼ ﺗﺎﺑﻊ ﻫﺰﯾﻨﻪﯼ ‪ K-means‬ﭼﮕﻮﻧﻪ ﺍﺳﺖ؟‬
‫)ﺏ( ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﻭﺍﺭ ﯾﺎﻧﺲ ﻭ ﭘﺮﺍﮐﻨﺪﮔﯽ ‪ ۱‬ﺩﺭ ﺗﺎﺑﻊ ﻫﺰﯾﻨﻪ ‪ K-means‬ﺭﺍ ﺩﺭ ﻧﻈﺮ ﺑﮕﯿﺮﺩ‪ ،‬ﻫﺮ ﮐﺪﺍﻡ ﺍﺯ ﺍﯾﻦ ﺗﺎﺑﻊ ﻫﺰﯾﻨﻪﻫﺎ‬
‫ﭼﻪ ﺗﺎﺛﯿﺮﯼ ﺩﺭ ﺳﺎﺧﺘﺎﺭ ﺧﻮﺷﻪﻫﺎ ﺩﺍﺭﻧﺪ؟‬
‫)ﺝ( ﺁﯾﺎ ﺩﻭ ﺗﺎﺑﻊ ﻫﺰﯾﻨﻪ ﺯﯾﺮ ﺑﺎ ﻫﻢ ﺑﺮﺍﺑﺮ ﻫﺴﺘﻨﺪ؟‬
‫)‪(۱‬‬
‫‪||xi − µk ||۲‬‬
‫)‪(۲‬‬
‫‪||xi − xj ||۲‬‬
‫∑‬
‫‪xi ∈Ck‬‬
‫| ‪|Ck‬‬
‫‪K‬‬
‫∑‬
‫‪k=۱‬‬
‫∑ ∑ ‪K‬‬
‫∑‬
‫‪k=۱ xi ∈Ck xj ∈Ck‬‬
‫‪scatter‬‬
‫‪۱‬‬
‫‪۱‬‬
‫‪ .۴‬ﻓﺮﺽ ﮐﻨﯿﺪ ﯾﮏ ﺗﻮﺯﯾﻊ ‪ GMM‬ﺑﺎ ﺩﻭ ﺧﻮﺷﻪ ﺩﺍﺭ ﯾﻢ ﮐﻪ ﭘﺎﺭﺍﻣﺘﺮﻫﺎﯼ ﺁﻥ ﺑﻪ ﺻﻮﺭﺕ ﺯﯾﺮ ﺍﺳﺖ‪:‬‬
‫)‪(۳‬‬
‫‪µ۱ = ۰, σ۱ = ۲‬‬
‫)‪(۴‬‬
‫‪µ۲ = ۰, σ۲ = ۳‬‬
‫ﺑﺎ ﺗﺨﻤﯿﻦ ﺑﯿﺸﯿﻨﻪ ﺩﺭﺳﺘﻨﻤﺎﯾﯽ ﺑﺮ ﺭ ﻭﯼ ﺩﺍﺩﻩﻫﺎﯼ ‪ ،{xi }, i = ۱, ..., n‬ﺿﺮ ﯾﺐ ﺗﺮﮐﯿﺐ ‪ ۲‬ﺑﻬﯿﻨﻪ ﺭﺍ ﺑﺮﺍﯼ ﻫﺮ ﮔﻮﺳﯽ ﭘﯿﺪﺍ‬
‫ﮐﻨﯿﺪ‪.‬‬
‫‪ .۵‬ﺑﻪ ﺳﻮﺍﻻﺕ ﺯﯾﺮ ﺩﺭﺑﺎﺭﻩ ﺗﻮﺯﯾﻊ ﮔﻮﺳﯽ ﭘﺎﺳﺦ ﺩﻫﯿﺪ‪:‬‬
‫)ﺁ( ﺍﻓﺰﺍﯾﺶ ﺗﻌﺪﺍﺩ ﮐﺎﻣﭙﻮﻧﻨﺖﻫﺎ ﺩﺭ ‪ Mixture model‬ﭼﻪ ﺗﺎﺛﯿﺮﯼ ﺑﺮ ﺭ ﻭﯼ ﻣﺪﻝﺳﺎﺯﯼ ﺩﺍﺭﺩ؟‬
‫)ﺏ( ﺗﻔﺎﻭﺕ ‪ K-means‬ﻭ ‪ GMM‬ﺩﺭ ﭼﻪ ﻣﻮﺍﺭﺩﯼ ﻫﺴﺖ؟‬
‫)ﺝ( ﺑﺎ ﻓﺮﺽ ﺍﯾﻨﮑﻪ ﺗﻮﺯﯾﻊ ﺗﻮﺍﻡ ﺩﻭ ﻣﺘﻐﯿﺮ ‪ x‬ﻭ ‪ y‬ﯾﮏ ‪ GMM‬ﺍﺳﺖ‪ ،‬ﺭﺍﺟﻊ ﺑﻪ ﺗﻮﺯﯾﻊ ‪ y‬ﺑﻪ ﺷﺮﻁ ‪ x‬ﭼﻪ ﻣﯽﺗﻮﺍﻥ ﮔﻔﺖ؟‬
‫‪ .۶‬ﺭ ﻭﺍﺑﻂ ﻣﺮﺑﻮﻁ ﺑﻪ ﺗﺨﻤﯿﻦ ﭘﺎﺭﺍﻣﺘﺮﻫﺎﯼ ﺗﻮﺯﯾﻊ ‪ Bernoulli mixture model‬ﺭﺍ ﺑﺎ ‪ MAP estimation‬ﺑﺪﺳﺖ ﺁﻭﺭﯾﺪ‪.‬‬
‫ﺗﻮﺯﯾﻊ ﺍﻭﻟﯿﻪ ﺭﺍ ‪ Beta‬ﺩﺭ ﻧﻈﺮ ﺑﮕﯿﺮ ﯾﺪ‪.‬‬
‫‪Mixing coefficient‬‬
‫‪۲‬‬
‫‪۲‬‬