ﺑﺴﻤﻪ ﺗﻌﺎﻟ اﻟ ﻮﺷﻨﺎﺳ آﻣﺎری ﻧﯿﻢﺳﺎل دوم ٩١-٩٢ دﮐﺘﺮ رﺑﯿﻌ داﻧﺸ ﺪه ﻣﻬﻨﺪﺳ ﮐﺎﻣﭙﯿﻮﺗﺮ ﺗﻤﺮﯾﻦ ﭼﻬﺎرم زﻣﺎن ﺗﺤﻮﯾﻞ ٩ :اردﯾﺒﻬﺸﺖ ﻣﺎﺷﯿﻦﻫﺎﯼ ﺑﺮﺩﺍﺭ ﭘﺸﺘﯿﺒﺎﻥ ﻭ ﺭ ﻭﺵﻫﺎﯼ ﺑﺮ ﭘﺎﯾﻪ ﻫﺴﺘﻪ .١در ﺻﻮرﺗ ﮐﻪ cﻋﺪدی ﺛﺎﺑﺖ وﺑﺰرﮔﺘﺮ از ﺻﻔﺮ و ) f (.ﺗﺎﺑﻌ دﻟﺨﻮاه و ) k۱ (x, x′و ) k۲ (x, x′ﮐﺮﻧﻞﻫﺎی ﻣﻌﺘﺒﺮی ﺑﺎﺷﻨﺪ ﺑﺎ اﺳﺘﻔﺎده از ﺗﻌﺮﯾﻒ ﻧﺸﺎن دﻫﯿﺪ ﮐﻪ ﮐﺮﻧﻞﻫﺎی زﯾﺮ ﻧﯿﺰ ﻣﻌﺘﺒﺮ ﻫﺴﺘﻨﺪ. )آ( ) k(x, x′ ) = ck۱ (x, x′ )ب( ) k(x, x′ ) = f (x)k۱ (x, x′ )f (x′ )ج( ) k(x, x′ ) = k۱ (x, x′ ) + k۲ (x, x′ )د( ) k(x, x′ ) = k۱ (x, x′ )k۲ (x, x′ ′ ۲ ∥ k(x, x′ ) = exp( −∥x−xﻣﻌﺘﺒﺮ اﺳﺖ .ﺳﭙﺲ ﺑﻪ ﺳﻮاﻻت زﯾﺮ .٢ﺑﺎ اﺳﺘﻔﺎده روشﻫﺎی ﺳﺎﺧﺖ ﮐﺮﻧﻞ ﻧﺸﺎن دﻫﯿﺪ ﮐﺮﻧﻞ ﮔﻮﺳ ) ۲σ ۲ ﭘﺎﺳ دﻫﯿﺪ: )آ( ﺑﻌﺪ دادهﻫﺎ در ﻓﻀﺎی ﺟﺪﯾﺪ ﭼﻨﺪ اﺳﺖ. )ب( ﺛﺎﺑﺖ ﮐﻨﯿﺪ ﻓﺎﺻﻠﻪ دو ﻧﻘﻄﻪ در ﻓﻀﺎی ﺟﺪﯾﺪ ﺑﻌﺪ از اﻋﻤﺎل ﻧ ﺎﺷﺖ ﻣﺮﺗﺒﻂ ﺑﺎ ﮐﺮﻧﻞ ﮔﻮﺳ ﮐﻤﺘﺮ از ٢ﺧﻮاﻫﺪ ﺑﻮد. .٣ﺑﺎ اﺳﺘﻔﺎده از ﻗﻀﯿﻪ Mercerﻧﺸﺎن دﻫﯿﺪ ﮐﻪ ﺗﺎﺑ ) k(x, x′ﯾ ﻫﺴﺘﻪ ﻣﻌﺘﺒﺮ اﺳﺖ. ) ϕi (x)ϕi (x′ ∞ ∑ = ) k(x, x′ i=۱ .۴ﻓﺮض ﮐﻨﯿﺪ Mﻣﺠﻤﻮﻋﻪ ای ﺛﺎﺑﺖ ﺷﺎﻣﻞ اﻋﻀﺎی دﻟﺨﻮاه )ﻋﺪدی و ﯾﺎ ﻏﯿﺮ ﻋﺪدی( ﺑﻮده و ﻓﻀﺎی ﺗﻤﺎﻣ زﯾﺮﻣﺠﻤﻮﻋﻪ ﻫﺎی ﻣﻤ ﻦ Mرا ﺑﺎ Aﻧﻤﺎﯾﺶ دﻫﯿﻢ .اﮔﺮ A۱و A۲دو ﻋﻀﻮ از Aﺑﺎﺷﻨﺪ ،ﺑﺎ ﺑﺪﺳﺖ آوردن ﺗﺎﺑ ﻧ ﺎﺷﺖ ﺛﺎﺑﺖ ﮐﻨﯿﺪ ﮐﻪ ﺗﺎﺑ زﯾﺮ ﯾ ﻫﺴﺘﻪ ﻣﻌﺘﺒﺮ ﻣ ﺑﺎﺷﺪ |.| ) .ﻧﻤﺎد ﺗﻌﺪاد اﻋﻀﺎی ﯾ ﻣﺠﻤﻮﻋﻪ ﻣ ﺑﺎﺷﺪ(. | k(A۱ , A۲ ) = ۲|A۱ ∩A۲ .۵ﻓﺮض ﮐﻨﯿﺪ xو x′دو ﺑﺮدار nﺑﻌﺪی ﺣﻘﯿﻘ ﺑﺎﺷﻨﺪ .اﮔﺮ ﺷﺒﺎﻫﺖ اﯾﻦ دو ﺑﺮدار را ﺑﻪ ﺻﻮرت ﺗﻌﺪاد اﺑﻌﺎدی ﺗﻌﺮﯾﻒ ﻧﻤﺎﯾﯿﻢ ،ﮐﻪ دراﯾﻪ ﻫﺎی ﻫﺮ دو ﺑﺮدار از ﻣﻘﺪار ﺣﻘﯿﻘ ﺛﺎﺑﺖ cﺑﺰرﮔﺘﺮ ﺑﺎﺷﻨﺪ ،ﺑﺎ ﯾﺎﻓﺘﻦ ﺗﺎﺑ ﻧ ﺎﺷﺖ ،ﺛﺎﺑﺖ ﻧﻤﺎﯾﯿﺪ ﮐﻪ اﯾﻦ ﺗﺎﺑ ﺷﺒﺎﻫﺖ ﯾ ﻫﺴﺘﻪ ﻣﻌﺘﺒﺮ ﻣ ﺑﺎﺷﺪ. .۶ﺑﺮای ﯾ ﻣﺠﻤﻮﻋﻪ داده ﻣﺸﺨﺺ ٩ ،دﯾﺎﮔﺮام ﺣﺎﺻﻞ از SVMﺑﺎ ﮐﺮﻧﻞﻫﺎی ﻣﺨﺘﻠﻒ ﺷﺪه در ﺟﺪول زﯾﺮ را در ﻧﻈﺮ ﺑ ﯿﺮﯾﺪ .در ﺟﺪول داده ﺷﺪه ،ﻣﺸﺨﺺ ﮐﻨﯿﺪ ﮐﻪ ﻫﺮ دﯾﺎﮔﺮام ﻣ ﺗﻮاﻧﺪ ﺗﻮﺳﻂ ﮐﺪام ﯾ از ﮐﺮﻧﻞﻫﺎ زﯾﺮ اﯾﺠﺎد ﺷﻮد؟ k۲ (x, x′ ) = (۱ + xT x′ )۲ −∥x − x′ ∥۲ ) ۰٫ ۵ (k۵ (x, x′ ) = exp −∥x − x′ ∥۲ ), ۰٫ ۲۲ ١ k۱ (x, x′ ) = xT x′ , (k۴ (x, x′ ) = exp −∥x − x′ ∥۲ ), ۰٫ ۰۸ (k۳ (x, x′ ) = exp .٧دﯾﺎﮔﺮامﻫﺎی زﯾﺮ ﻣﺠﻤﻮﻋﻪ دادهﻫﺎی ﻣﺠﺰاﯾ را ﻧﻤﺎﯾﺶ ﻣ دﻫﻨﺪ .ﻓﺮض ﮐﻨﯿﺪ ﮐﺮﻧﻞﻫﺎی (۱ + xT x′ )۲ ،xT x′و RBFﺑﺎ σ = ۰٫ ۱و σ = ۲را داﺷﺘﻪ ﺑﺎﺷﯿﻢ .ﺑﺮای ﻫﺮ دﯾﺎﮔﺮام ،ﺳﺎدهﺗﺮﯾﻦ ﮐﺮﻧﻠ ﮐﻪ ﺗﻤﺎﻣ دادهﻫﺎ را ﺑﺪرﺳﺘ ﮐﻼﺳﻪﺑﻨﺪی ﻣ ﮐﻨﺪ، ﺗﻌﺪاد ﺑﺮدارﻫﺎی ﭘﺸﺘﯿﺒﺎن ﻣﺮز ﺗﺼﻤﯿﻢﮔﯿﺮی و ﺣﺎﺷﯿﻪﻫﺎی اﻣﻨﯿﺖ ﻣﺮﺑﻮﻃﻪ را ﻣﺸﺨﺺ ﻧﻤﺎﯾﯿﺪ. .٨ﻣﺠﻤﻮﻋﻪ ﻧﻘﺎط زﯾﺮ از دو ﮐﻼس C۱و C۲را در ﻓﻀﺎی دوﺑﻌﺪی در ﻧﻈﺮ ﺑ ﯿﺮﯾﺪ. }] [ ] [ ] [{ }] [ ] [{ ۳ ۳ ۱ ۵ ۷ = C۱ , , = , C۲ , ۳ ۵ ۲ ۱ ۲ ﺑﺮای ﯾ ﻃﺒﻘﻪ ﺑﻨﺪ Hard SVMﺧﻄ ، )آ( ﺑﺮدارﻫﺎی ﭘﺸﺘﯿﺒﺎن را ﻣﺸﺨﺺ ﻧﻤﺎﯾﯿﺪ. )ب( ﺿﺮاﯾﺐ ﻻﮔﺮاﻧﮋ را ﺑﺮای ﮐﻠﯿﻪ ﻧﻘﺎط ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﺪ. )ج( ﻣﺮز ﻃﺒﻘﻪ ﺑﻨﺪی را ﺑﺪﺳﺖ آورﯾﺪ. .٩ﻣﺴﺄﻟﻪ ﻃﺒﻘﻪ ﺑﻨﺪی ﯾ ﺑﻌﺪی ﺑﺎ ﻣﺠﻤﻮﻋﻪ داده و ﮐﻼس ﻫﺎی زﯾﺮ را در ﻧﻈﺮ ﺑ ﯿﺮﯾﺪ. }] [ ] +۱ −۱ , +۱ −۱ ﻓﺮض ﮐﻨﯿﺪ ﺑﺮای ﻃﺒﻘﻪ ﺑﻨﺪی از ﯾ ﻧﻤﺎﯾﺶ ﻣ دﻫﯿﻢ. }] [{ = Data Class [{ Soft SVMﺑﺎ ﺗﺎﺑ Hingeاﺳﺘﻔﺎده ﻧﻤﺎﯾﯿﻢ .ﻣﺮز اﯾﻦ دﺳﺘﻪ ﺑﻨﺪ را ﺑﻪ ﺻﻮرت wx + b = ۰ )آ( ﻓﺮم اﺳﺘﺎﻧﺪارد ﻣﺴﺄﻟﻪ ﺑﻬﯿﻨﻪ ﺳﺎزی QPرا ﻫﻤﺮاه ﺑﺎ ﻣﺘﻐﯿﺮ ﻫﺎی slackﺑﺮای اﯾﻦ ﻣﺴﺄﻟﻪ ﺑﻨﻮﯾﺴﯿﺪ. ٢ )ب( اﮔﺮ ﺑﺪاﻧﯿﻢ wﺑﻬﯿﻨﻪ ﺑﻪ ﺻﻮرت ) w∗ = min(C, ۱ﺑﺎﺷﺪ )ﮐﻪ در آن Cﺿﺮﯾﺐ ﻣﺘﻐﯿﺮﻫﺎی slackاﺳﺖ( ،ﻣﻘﺪار ﺑﻬﯿﻨﻪ bرا ﺑﺮ ﺣﺴﺐ Cﺑﺪﺳﺖ آورﯾﺪ. ﻳﻚ ﻣﺠﻤﻮﻋﻪ از ﺗﺼﺎوﻳﺮ ارﻗﺎم دﺳﺘﻨﻮﻳﺲ اﻧ ﻠﻴﺴ را در ﻧﻈﺮ ﺑ ﻴﺮﻳﺪ )ﻣﺠﻤﻮﻋﻪ اﺳﺘﺎﻧﺪارد .(USPSﻫﺮ ﺗﺼﻮﻳﺮ ﺑﻪ ﺻﻮرت .١٠ ﻳﻚ ﻣﺎﺗﺮﻳﺲ ٢٨×٢٨ﻧﺸﺎن داده ﻣ ﺷﻮد .ﻣ ﺗﻮان ﺑﺎ ﺳﻄﺮی ﻛﺮدن ،ﻫﺮ ﺗﺼﻮﻳﺮ را ﺑـﻪ ﺻـﻮرت ﻳـﻚ ﺑـﺮدار ١×٧٨۴ﻧﻤـﺎﻳﺶ داد .ﻫﺪف ﺗﺸﺨﻴﺺ رﻗﻢ ﻣﺘﻨﺎﻇﺮ ﺑﺎ ﻳﻚ ﺗﺼﻮﻳﺮ اﺳﺖ .ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ اﻳﻨ ﻪ در اﻳﻦ ﻣﺴﺌﻠﻪ ١٠ﻛﻼس ﻣﺨﺘﻠﻒ وﺟﻮد دارد ،از روش One-Against-Allﺑﺮای ﺟﺪاﺳﺎزی اﺳﺘﻔﺎده ﻣ ﻛﻨـﻴﻢ .ﻫﻤﭽﻨﻴﻦ ﻗﺒﻞ از اﻋﻤﺎل داده ﻫﺎ ﺑﻪ روش ﻫﺎی ﻳﺎدﮔﻴﺮی ،از ﺳﻔﻴﺪ ﻛﺮدن داده ﻫﺎ ) (Whiteningﺑﺎ ۵٠ﺑﻌﺪ اول اﺳﺘﻔﺎده ﺷﻮد .ﺑﺮای دﺳﺘﻪ ﺑﻨﺪی داده از دو روش زﯾﺮ اﺳﺘﻔﺎده و آﻧﻬﺎ را ﺑﺎ ﻫﻢ ﻣﻘﺎﻳﺴﻪ ﻛﻨﻴﺪ : )آ( SVMﺑﺎ ﻫﺴﺘﻪ ﺧﻄ )ب( SVMﺑﺎ ﻫﺴﺘﻪ RBF در اﻳﻦ ﭘﺎﻳ ﺎه داده ﻫﺎ ۶٠٠٠٠ ،ﺗﺼﻮﻳﺮ وﺟﻮد دارد .ﺑﺮای ﻫﺮ روش آزﻣﺎﻳﺶ ﻫﺎی زﻳﺮ را ﺗﺮﺗﻴﺐ دﻫﻴﺪ : )آ( ﺗﻌﺪاد داده آﻣﻮزﺷ ٢٠٠٠ﺑﺎﺷﺪ. )ب( ﺗﻌﺪاد داده آﻣﻮزﺷ ١٠٠٠ﺑﺎﺷﺪ. )ج( ﺗﻌﺪاد داده آﻣﻮزﺷ ٢٠٠ﺑﺎﺷﺪ. ﺑﺮاي ﻫﺮ آزﻣﺎﻳﺶ از Cross-Validationﺑﺎ ﻣﺠﻤﻮﻋﻪ ١٠٠ Validationﺗﺎﯾ ﺑﺮای ﺑﺪﺳﺖ آوردن Cﺑﻬﻴﻨﻪ SVMو ﭘﻬﻨـﺎی ﺑﺎﻧﺪ ﺑﻬﻴﻨﻪ SVMدر ﺣﺎﻟﺖ ﻫﺴﺘﻪ RBFاﺳﺘﻔﺎده ﻛﻨﻴﺪ. ﻫﺮ آزﻣﺎﻳﺶ را ١٠ﺑﺎر ﺗ ﺮار ﻛﻨﻴﺪ )ﺑﺎ داده ﻫﺎی آﻣﻮزﺷ ﺗﺼﺎدﻓ (. )آ( ﻣﻴﺎﻧ ﻴﻦ دﻗﺖ ﻫﺮ روش را ﺑﺪﺳﺖ آورﻳﺪ. )ب( Support Vectorﻫﺎ در SVMرا ﺑﺮای ﯾ ﺧﺎﺻ دارﻧﺪ ﻳﺎ ﺧﻴﺮ. از اﺟﺮاﻫﺎ ﻧﻤﺎﻳﺶ دﻫﻴﺪ .آﻳﺎ اﻳﻦ داده ﻫﺎ ﺑﺎ داده ﻫﺎی دﻳ ﺮ ﻳﺎدﮔﻴﺮی ﺗﻔﺎوت )ج( ﻣﺘﻮﺳﻂ ﻣﻘﺪار Marginﻣﺎﺑﯿﻦ ﻣﺮزﻫﺎی ﺑﺪﺳﺖ آﻣﺪه و ١٠اﺟﺮا ،ﺑﺮای ﻫﺮ دو ﺣﺎﻟﺖ SVMﺧﻄ و SVMﺑﺎ ﻫﺴﺘﻪ RBF را ﺑﻪ ﻃﻮر ﺟﺪاﮔﺎﻧﻪ ﻣﺤﺎﺳﺒﻪ ﮐﻨﯿﺪ. )د( آﻳﺎ اﺳﺘﻔﺎده از ﻫﺴﺘﻪ RBFﺑﻬﺒﻮدی ﻧﺴﺒﺖ ﺑﻪ ﺣﺎﻟﺖ ﺧﻄ SVMاﻳﺠﺎد ﻣ ﻛﻨﺪ؟ ٣
© Copyright 2025 Paperzz