ﺑﻪ ﻧﺎم ﺧﺪا داﻧﺸﮑﺪه ﻣﻬﻨﺪﺳﯽ ﮐﺎﻣﭙﯿﻮﺗﺮ ،داﻧﺸﮕﺎه ﺻﻨﻌﺘﯽ ﺷﺮﯾﻒ ﺗﻤﺮﯾﻦ ﺳﺮي دوم )ﭘﯿﺶﭘﺮدازش داده و ﻣﺼﻮرﺳﺎزي( درس دادهﮐﺎوي ﺑﺮاي اﻧﺠﺎم اﯾﻦ ﺳﺮي ﺗﻤﺮﯾﻦ ﺑﻪ ﻧﮑﺎت زﯾﺮ ﺗﻮﺟﻪ ﻧﻤﺎﯾﯿﺪ: ﺗﻤﺮﯾﻦﻫﺎ ﺑﻪ ﺻﻮرت اﻧﻔﺮادي اﻧﺠﺎم ﺷﻮد ﮔﺰارش ﺧﻮد را ﺑﻪ آدرس [email protected]ﺣﺪاﮐﺜﺮ ﺗﺎ ﺗﺎرﯾﺦ 30آﺑﺎن ارﺳﺎل ﻧﻤﺎﯾﯿﺪ. ﻣﺠﻤﻮﻋﻪﻫﺎي داده از ﺳﺎﯾﺖ درس ﻗﺎﺑﻞ داﻧﻠﻮد ﻣﯽﺑﺎﺷﺪ. در ﺻﻮرت اﺑﻬﺎم ﺳﻮاﻻت ﺧﻮد را ﺑﻪ ﯾﮑﯽ از اﯾﻤﯿﻞﻫﺎي زﯾﺮ ﺑﻔﺮﺳﺘﯿﺪ: [email protected] [email protected] 1 .1ﺑﺮرﺳﯽ ﮐﻨﯿﺪ ﺑﺎ ﮐﺪام ﯾﮏ از ﻣﺪلﻫﺎي دﺳﺘﻪﺑﻨﺪي ﻣﻮﺟﻮد در ﯾﮑﯽ از اﺑﺰارﻫـﺎي Rapid Minerﯾـﺎ SPSS Clementineﻣﯽﺗﻮان ﺑﻪ دﻗﺖ ﺑﺎﻻﺗﺮي در ﭘﯿﺶﺑﯿﻨﯽ وﯾﮋﮔﯽ ﻫﺪف در ﻣﺠﻤﻮﻋﻪ داده churnدﺳﺖ ﯾﺎﻓـﺖ و ﻧﺘﯿﺠﻪ ﺣﺎﺻﻞ از ﺑﻬﺘﺮﯾﻦ ﻣﺪل را ﺑﺎ دﻗـﺖ ﺗﺤﻠﯿـﻞ ﮐﻨﯿـﺪ .ﻻزم ﺑـﻪ ذﮐـﺮ اﺳـﺖ 0/7از ﻣﺠﻤﻮﻋـﻪ داده را ﺑـﻪ ﯾﺎدﮔﯿﺮي ﻣﺪل و ﺑﺎﻗﯽ آنرا ﺑﻪ آزﻣﻮن اﺧﺘﺼﺎص دﻫﯿﺪ(%15). .2ﺑﻪ ﻣﺠﻤﻮﻋﻪ داده assignment2ﮐﻪ ﺑﺮاﯾﺘﺎن ارﺳـﺎل ﺷـﺪه اﺳـﺖ دﻗـﺖ ﮐﻨﯿـﺪ .اﯾـﻦ ﻣﺠﻤﻮﻋـﻪ داده ﺷـﺎﻣﻞ ﺗﻌﺪادي ﺷﯽء و وﯾﮋﮔﯽﻫﺎي آن اﺳﺖ ﮐﻪ ﯾﮑﯽ از اﯾﻦ وﯾﮋﮔﯽﻫﺎ وﯾﮋﮔﯽ ﻫﺪف ﻣﯽﺑﺎﺷـﺪ .ﺑﺮرﺳـﯽ ﮐﻨﯿـﺪ ﭼـﻪ ﻣﺪلﻫﺎﯾﯽ ﺑﺮاي دﺳﺘﻪﺑﻨﺪي اﺣﺘﻤﺎﻻﺗﯽ 2اﯾﻦ ﻣﺠﻤﻮﻋﻪ داده ﻣﻨﺎﺳﺐ اﺳـﺖ .ﻧﺘـﺎﯾﺞ ﺣﺎﺻـﻞ را در ﻗﺎﻟـﺐ ﯾـﮏ ﮔﺰارش اراﺋﻪ دﻫﯿﺪ .ﻻزم ﺑﻪ ذﮐﺮ اﺳﺖ ﺑﺮاي ﺟﻮاب ﺑﻪ اﯾﻦ ﻣﺴﺌﻠﻪ ﻣـﯽﺗﻮاﻧﯿـﺪ از ﻫـﺮ زﺑـﺎن ﺑﺮﻧﺎﻣـﻪﺳـﺎزي ﯾـﺎ اﺑﺰاري اﺳﺘﻔﺎده ﮐﻨﯿﺪ) .ﻫﺪف دﺳﺘﯿﺎﺑﯽ ﺑﻪ ﺑﻬﺘﺮﯾﻦ ﻧﺘﯿﺠﻪ اﺳﺖ()(%50 ﺗﺬﮐﺮ :ﻧﻤﺮه اﯾﻦ ﺗﻤﺮﯾﻦ ﺑﺮ اﺳﺎس دﻗﺖ ﻣﺪل ﺣﺎﺻﻞ ﻣـﯽﺑﺎﺷـﺪ و ﻣـﺪل ﯾﺎدﮔﺮﻓﺘـﻪ ﺷـﺪه ﻧﯿـﺰ ﺑﺎﯾـﺪ ﺗﺤﻮﯾﻞ داده ﺷﻮد. .3ﺑﺮاي ﭘﺎﺳﺦ ﺑﻪ ﺗﻤﺮﯾﻦ زﯾﺮ از ﻣﺠﻤﻮﻋﻪﻫﺎي داده churnو assignment2اﺳﺘﻔﺎده ﮐﻨﯿﺪ .ﭘﺲ از ﻧﺮﻣﺎلﺳـﺎزي وﯾﮋﮔﯽﻫﺎي ﻋﺪدي ﻣﺮاﺣﻞ زﯾﺮ را اﻧﺠﺎم دﻫﯿﺪ(%35) : ﯾﮏ درﺧﺖ ﺗﺼﻤﯿﻢ CARTﺑﺴﺎزﯾﺪ. ٢ﻣﻧظور از دﺳﺗﮫﺑﻧدی اﺣﺗﻣﺎﻻﺗﯽ ﯾﺎدﮔﯾری ﻣدﻟﯽ اﺳت ﮐﮫ ﺑﺎ اﺣﺗﻣﺎﻟﯽ ،ﯾﮏ ﯾﺎ ﺻﻔر ﺑودن وﯾژﮔﯽ ھدف را ﭘﯾشﺑﯾﻧﯽ ﮐﻧد. Classification 1 ﯾﮏ درﺧﺖ ﺗﺼﻤﯿﻢ C4.5ﺑﺴﺎزﯾﺪ. دو درﺧﺖ ﺗﺼﻤﯿﻢ ﺣﺎﺻﻞ را ﻣﻘﺎﯾﺴﻪ و ﻣﺰاﯾﺎ و ﻣﻌﺎﯾﺐ ﻫﺮ ﮐﺪام را ﺑﺮرﺳﯽ ﮐﻨﯿﺪ. ﻣﺠﻤﻮﻋﻪ ﻗﻮاﻧﯿﻦ ﺗﺼﻤﯿﻢﮔﯿﺮي ﮐﺎﻣﻠﯽ را از درﺧﺖ ﺗﺼﻤﯿﻢ CARTاﺳﺘﺨﺮاج ﮐﻨﯿﺪ. ﻣﺠﻤﻮﻋﻪ ﻗﻮاﻧﯿﻦ ﺗﺼﻤﯿﻢﮔﯿﺮي ﮐﺎﻣﻠﯽ را از درﺧﺖ ﺗﺼﻤﯿﻢ C4.5اﺳﺘﺨﺮاج ﮐﻨﯿﺪ. دو ﻣﺠﻤﻮﻋﻪ ﻗﻮاﻧﯿﻦ ﺗﺼﻤﯿﻢﮔﯿﺮي ﺣﺎﺻﻞ را ﻣﻘﺎﯾﺴﻪ و ﻣﺰاﯾﺎ و ﻣﻌﺎﯾﺐ ﻫﺮ ﮐﺪام را ﺑﺮرﺳﯽ ﮐﻨﯿﺪ.
© Copyright 2025 Paperzz