اﻃﻼﻋﺎت 40324 ت ﭘﺮوژه دوم – ﺑﺎزﻳﺎﺑﻲ ﭘﻴﺸﺮﺮﻓﺘﻪي ﻧﻴﻴﻤﺴﺎل اول 92-91 ﻣﺪرس :ﺳﻠﻴﻴﻤﺎﻧﻲ ﻞ 10 :دي 91 ﻣﻮﻋﺪ ﺗﺤﻮﻳﻞ ﺑﻪ ﻧﺎم ﺧﺪا ﭘﺮوژهه دوم درس ﺑﺎزﻳﺎﺑﻲ ﭘﻴﺸﺮﺮﻓﺘﻪي اﻃﻼﻋﺎت ي و ﺗﺤﻮﻳﻞ ﭘﺮوژژه دﻗﺖ ﻧﻤﺎﻳﻴﺪ: ﻟﻄﻄﻔﺎً ﺑﻪ ﻣﻮارد زﻳﺮﺮ در آﻣﺎدهﺳﺎزي - ﭼﻨﺎنﭼﻪﻪ ﺳﻮاﻟﻲ در راﺑﻄﻄﻪ ﺑﺎ ﭘﺮوژه داﺷﺷﺘﻴﺪ ﺑﻪ ﮔﺮوه دررس اﻳﻤﻴﻞ ﺑﻔﺮﺳﺳﺘﻴﺪ . - ﻞﻫﺎي ارﺳﺎﻟﻲ ﺑﺎﻳﻳﺪ در ﻳﻚ ﭘﻮﺷﻪﻪ ﻓﺸﺮده ﺑﺎﺷﺪ ﻛﺪ ﭘﺮوژه ﺧﻮد را ﺑﻪ آدرس [email protected]ارﺳﺳﺎل ﻧﻤﺎﻳﻴﺪ .ﻓﺎﻳﻞ ﻞ ﺑﻪ ﺻﻮرت ﻢ ﺟﺪا ﺷﺪهاﻧﺪ ،اﺳﺖ .ﻫﻤﭽﻨﻴﻴﻦ ﻋﻨﻮان اﻳﻤﻴﻞ ﻀﺎي ﮔﺮوه ﻛﻪ ﺑﺎ "_" از ﻫﻢ ﻢ آن ﺷﻤﺎره دداﻧﺸﺠﻮﻳﻲ اﻋﻀ ﻛﻪ اﺳﻢ StudentID1_StudentID2_Proﻳﺎ در ﺻ oject2 ﺻﻮرت ﺗﻚﻧﻔﺮه ﺑﻮدن ﭘﺮوژه StudenttID_Project2ﺑﺎﺷﺪ .ﻣﻬﻠﺖ ارﺳﺎل ﮔﺰارش آن ﺗﺎ ﺳﺎﺎﻋﺖ 24ﻣﻮﻋﺪ ﻣﻘﺮر اﺳﺖ . ﻛﺪ و ﮔﺰ - ﻛﺪ ﺑﺮﻧﺎﻣﻪ ﺑﺎﻳﺪ ﭘﻴﺎدهﺳﺎﺎزي ﺧﻮد ﺷﻤﺎ ﺑﺑﺎﺷﺪ . - ﺧﻮاﻫﺪ ﮔﺮﻓﺖ . ﺪ ﺗﺤﻮﻳﻞ ﭘﺮوژه ﺑﻪ ﺻﻮرت ﺣﻀﻮري ﻧﻴﺰﺰ ﺻﻮرت ﻞ - ش و ﺗﺤﻠﻴﻞ ﻧﺘﺎﻳﺞ اﺧﺘﺼﺎص داردد. ﺑﺨﺶ ﻗﻗﺎﺑﻞ ﺗﻮﺟﻬﻲ از ﻧﻧﻤﺮه ﺑﻪ ﮔﺰارش ﭘﺮﺮوژه دووم ﺸﺮﻓﺘﻪ اﻃﻼﻋﺎت ﻗﺮار اﺳﺖ ﻳﻚ ﻣﻮﺗﻮر ﺟﺴﺘﺠﻮﻮي وب ﺳﺎده ﻃﻃﺮاﺣﻲ و ﭘﻴﺎده ﺳﺳﺎزي ﻧﻤﺎﻳﻴﺪ .ﺑﺮﺮاي اﻳﻦ ﻣﻨﻈﻮر درر ﭘﺮوژه دوم دررس ﺑﺎزﻳﺎﺑﻲ ﭘﻴﺸ ﻊآوري ﻧﻤﺎﻳﺪ .ﺳﺳﭙﺲ ﻋﻤﻠﻴﺎت ﺨﺺ ﺷﺪه ﺟﻤﻊ ﺤﺎت وب را از داﻣﻨﻪﻫﺎي ﻣﺸﺨ ي ﻛﻨﻴﺪ ﻛﻪ ﺻﻔﺤ ﻲ و ﭘﻴﺎدهﺳﺎزي اﺑﺘﺘﺪا ﺑﺎﻳﺪ ﻳﻚ Crawleerﻃﺮاﺣﻲ ﺐ ﺷﺪه ﻓﺮاﻫﻢ ﺷﺷﻮد. ﻲ ﺻﻔﺤﺎت ﻣﺮﺗﺒﺒﻂ ﺑﺎ ﭘﺮﺳﻤﺎن ﺑﺑﻪ ﺻﻮرت ﻣﺮﺗﺐ ﺻﻔﺤﺎت ﺻﻮرت ﮔﺮﻓﺘﻪﻪ و اﻣﻜﺎن ﺑﺎزﻳﺎﺑﻲ ت ﺷﺎﺎﺧﺺﮔﺬاري رووي اﻳﻦ ﺖﻫﺎي زﻳﺮ ﻓﺮاﻫﻫﻢ ﺷﻮد: ﺑﻪ اﻳﻦ ﺗﺮﺗﻴﺐ ﺑﺮاي اﻳﺠﺎد ﻣﻮﺗﻮر ﺟﺴﺘﺠﻮي ﻣﻮرددﻧﻈﺮ ﺑﺎﻳﺪ ﻗﺎﺑﻠﻴﺖ ﭘﺮدازش ﺳﻨﺪ )ﺻﻔﺤﻪ وب( ،اﺳﺘﺨﺮاج ش ج ﻟﻴﻨﻚﻫﺎي ﻣﻮﺟﺟﻮد در آن و ﻫﻫﻤﭽﻨﻴﻦ ﺗﺒﺪﻳﻞ ﻣﺤﺘﻮاي ﻣﺘﻨﻲ أ .ﭘﻴﺶﭘﺮﺮدازش :ﻣﻨﻈﻮر از ﭘﻴﺶ ﺻﻔﺤﻪ ﺑﻪ ﺻﻮرت دﻧﺒﺎﻟﻪاي از واژهﻫﺎﺳﺳﺖ .در ﺑﺨﺶ ﭘﻴﺎدهﺳﺎزي ﺑﺮااي اﻳﻦ ﻣﻨﻈﻮر webScanner packageدر ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه اﺳﺳﺖ ﻛﻪ ﺷﺎﻣﻞ ددو ﻛﻼس اﺻﻠﻲ زﻳﺮ اﺳﺖ ﻛﻪ ﺑﺎﺎﻳﺴﺘﻲ ﺗﻜﻤﻴﻞ ﺷﺷﻮﻧﺪ : اﻃﻼﻋﺎت 40324 ت ﭘﺮوژه دوم – ﺑﺎزﻳﺎﺑﻲ ﭘﻴﺸﺮﺮﻓﺘﻪي ﻧﻴﻴﻤﺴﺎل اول 92-91 ﻣﺪرس :ﺳﻠﻴﻴﻤﺎﻧﻲ ﻞ 10 :دي 91 ﻣﻮﻋﺪ ﺗﺤﻮﻳﻞ :WebResoاﻳﻳﻦ ﻛﻼس ﻣﺴﺌﻮﻮﻟﻴﺖ parseﻛﻛﺮدن ﻣﺤﺘﻮاي ﻳﻚ ﺻﻔﺤﻪي htmlرا ﺑﺮﻋﻬﺪه دارد .ﺑﻪ اﻳﻦ ourceScanneerش ﻣﻲﻛﻨﺪ .در اﻳﻦ ﭘﺮدازش اوﻻً ﻣﺤﺘﻮاي ﻣﺘﺘﻨﻲ ﻓﺎﻳﻞ اﺳﺘﺨﺮﺮاج ﻣﻲﺷﻮد و ﺗﺮﺗﻴﺐ ﻛﻪ ﻓﺎﻳﻞ ﻫﺎي htmlدررﻳﺎﻓﺘﻲ را ﭘﺮدازش ﺻﻔﺤﺎت دﻳﮕﺮ ))ﺗﮓ ﻫﺎي aدرر (htmlﺑﺮاي اداﻣﻪي ﺧﺰش ﮓﻫﺎي اﺿﺎﻓﻪ دوور رﻳﺨﺘﻪ ﻣﻲﺷﻮﻮﻧﺪ و ﻧﻴﺰ ﻛﻠﻴﻪي آدرسﻫﺎي ﺻ ﺗﮓ ﺶ ﻣﻲﺗﻮاﻧﻴﺪ از ﻛﺘﺎﺑﺨﺎﻧﻪﻫﺎي آآﻣﺎدهي ﺟﺎوا ﻧﻈﻈﻴﺮ Jsoupﻳﺎ ﻫﺮﻛﺘﺎﺑﺨﺎﻧﻪي ددﻳﮕﺮي اﺳﺘﻔﺎده اﺳﺳﺘﺨﺮاج ﻣﻲﺷﻮد .ﺑﺮاي اﻳﻦ ﺑﺨﺶ ﻨﻴﺪ . ﻛﻨﻴ ﺲ از اﺳﺘﺨﺮاج ﻣﺤﺘﻮاي ﻣﺘﻨﻲ در ﻣﺮﺣﻠﻪي ﻗﺒﺒﻞ ،ﺣﺎﻻ ﺗﻮﺳﻂ ﻳﻚ tokkenizerﻧﻈﻴﺮ آﻧﭽﻪ در ﭘﺮوژه اول :Tokenizeerﭘﺲﺣﺬف stopword stemو ف داﺷﺘﻪ ﺑﺎﺷﻴﺪ ﻛﻪ ﻧﻴﺎزي ﺑﻪ mming ﻪ ﺪا ﻧﻤﺎﻳﻴﺪ .ﻫﻤﭽﻨﻨﻴﻦ ﺗﻮﺟﻪ داﺷﺷﺘﻴﻢ token ،ﻫﺎي ﻣﺘﻦ را ﺟﺪ ﺑﻊ ﭘﻴﺎدهﺳﺎزي ﺷﺷﺪه در ﭘﺮوژهي اول اﺳﺘﻔﺎده ﻛﻨﻨﻴﺪ . ﻫﺎ ﻧﻴﺴﺖ .ﻣﻲﺗﻮاﻧﻴﻴﺪ از ﻫﻤﺎن ﺗﻮاﺑﻊ ب در داﻣﻨﻪاي ﻛﻪ در اﺧﺘﻴﺎر ﺷﻤﺎ ﮔﺬاﺷﺘﻪ ﺧﺧﻮاﻫﺪ ﺷﺪ .ﺑﺮاي اﻳﻦ ﻣﻨﻈﻮر ب .ﺧﺰﺷﮕﺮﺮ ) (crawlerﺑﺮاي ﺟﻤﻊآوري ﺻﻔﺤﺎت وب ي ﺷﻮد : ﺴﺘﻲ ﭘﻴﺎده ﺳﺎزي ﻲ اﺳﺖ ﻛﻪ ﺑﺎﻳﺴ ﻞ 3ﻛﻼس اﺻﻠﻲ ccrawler pacckageدر ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه اﺳﺖ ﻛﻪ اﻳﻦ ﭘﻮﺷﻪ ﺷﺎﻣﻞ :WebCrawleerاﻳﻦ ﻛﻼس وﻇﻇﻴﻔﻪي ﺧﺰش ددر وب را ﺑﺮﻋﻬﻬﺪه دارد .ﺑﺎ اﺳﺘﺘﻔﺎده از ﻳﻚ ﻓﺎﻳﻳﻞ ورودي ﻛﻪ ﺷﺎﻣﻞ ﺗﻌﺪاديﺖ ﻛﺎر را ﺷﺮوع ﻛﺮده و ﻟﻴﻨﻚﻫﻫﺎي ﻣﻮﺟﻮد در ﻫﺮ ﺻﻔﺤﻪ را اﺳﺘﺨﺮاج ﻣﻲﻛﻨﺪ آددرس اوﻟﻴﻪ اﺳﺖ ﺪ .ﺳﭙﺲ ﺑﺎ ﺑﻪﻛﻛﺎرﮔﻴﺮي روش ﺗﺮﺗﻴﺐ ﻛﺎر را اداﻣﻪ ﻣﻣﻲدﻫﺪ: ﺴﺘﺠﻮي ﺳﻄﺢ اول ) (BFSاﻳﻦ ﻟﻴﻨﻚﻫﺎ را ﭘﻴﻤﺎﻳﻳﺶ ﻣﻲﻧﻤﺎﻳﺪ و ﺑﻪ ﻫﻤﻴﻦ ﺐ ﺟﺴ http:///en.wikipedﺷﺮوع ﺤﻪي اﺻﻠﻲ dia.org/wiki/Main_Pagge ﺑﻪ ﻋﻨﻮان ﻧﻤﻮﻧﻪ ﺑﺑﺮاي crawlﻣﻣﻲﺗﻮاﻧﻴﺪ از ﺻﻔﺤ ﺻﻔﺤﺎﺗﻲ ﻛﻪ ﺑﻪ ﻓﺮم htttp://en.wikkipedia.org/wiki/articlee_nameﻫﺴﺘﻨﺪ را ﭘﭘﺮدازش ﻛﻨﻴﺪ. ﻨﻴﺪ و ﻫﻤﻪي ﺻ ﻛﻨﻴ ﻲﺷﻮﻧﺪ و ﻻزم ﻲ ﻟﻴﻨﻚ داده ﻣﻲ ﻚ داده ﺷﺪه ﺑﻪ ﺻﻮرت ﻧﺴﺒﻲ ﺪ ﻛﻪ در ﺑﺴﻴﺎرري از ﺻﻔﺤﺎت آدرسﻫﺎي ﻟﻴﻨﻚ ﺗﻮﺟﺟﻪ داﺷﺘﻪ ﺑﺎﺷﻴﺪ اﺳﺳﺖ domainآآدرس ﻛﻨﻮﻧﻲ ررا ﺑﻪ اﺑﺘﺪاي آدررس ﺑﻪدﺳﺖ آﻣﻣﺪه اﺿﺎﻓﻪ ﻛﻨﻴﺪ ﺗﺎ ﻳﻚ آدرس ﻣﻌﺘﺒﺮ ﺑﺪﺳﺖ آآﻳﺪ . ﻲﻛﻨﺪ .ﻫﺮﺑﺎر ﺑﺎ :Uﻫﻤﺎن ﻟﻴﺴﺖ ﻣﻮرد اﺳﺘﻔﺎده در اﻟﮕﻮرﻳﺘﻢ BFSSاﺳﺖ ﻛﻪ Crawlerاز آآن اﺳﺘﻔﺎده ﻣﻲ URL_frontieerﻲ ﺷﺪه از اﺑﺘﺪاي ﻒ اﻓﺰوده ﺷﺪه و آدرس ﺑﺮرﺳﻲ س ،آدرسﻫﺎي ﻣﻮﺟﻮد در آن ﺑﻪ اﻧﺘﻬﺎي ﺻﻒ ﺑﺮرﺳﻲ ﻳﻚ آدرس ي ﺻﻒ ﺣﺬف ﻲﺷﻮد . ﻣﻲ ﻲ ﻛﻨﺪ ﻛﻪ آﻳﺎ ددو ﻣﺘﻦ ﺣﺎوي ﻚ روش ﺑﺮرﺳﻲ :DoubleConاﻳﻦ ﻛﻼس وﻇﻇﻴﻔﻪ دارد ﺑﺎ ﺑﻪﻪ ﻛﺎرﮔﻴﺮي ﻳﻚ ntentCheckeerﻚ ﺳﻨﺪ ﺟﺪﻳﺪ درر ﻧﻈﺮ ﺑﮕﻴﺮﻳﺪ. ﺪ ﻣﺘﻦ ﻣﺮﺑﻮﻃﻪ ررا ﺑﻪ ﻋﻨﻮان ﻳﻚ ﺤﺘﻮاي ﺗﻜﺮاري ﻫﻫﺴﺘﻨﺪ ﻳﺎ ﺧﻴﺮ .در ﺻﻮرت ﺗﻜﺮاري ﺑﻮدن ﻧﺒﺎﻳﺪ ﻣﺤ ﻞ دﻧﺒﺎﻟﻪاي از ﺤﺎت و ﭘﻴﺶﭘﺮددازش ،ﺗﻌﺪادي ﺳﻨﺪ دارﻳﻢ ﻛﻪﻪ ﻫﺮﻛﺪام ﺷﺎﻣﻞ ﺷﺎﺧﺺﮔﺬاري و ﺑﺎزﻳﻳﺎﺑﻲ :ﭘﺲ از ﺟﺟﻤﻊآوري ﺻﻔﺤ ﺺ ج. ﺸﺎﺑﻪ آﻧﭽﻪ در ﻓﺎﺎز ﻗﺒﻞ داﺷﺘﻴﻢ ﺑﺎﻳﺪ اﻳﻦ ﺳﻨﺪﻫﺎ ﺷﺎﺧﺺ ﮔﺬاري ﺷﺪه و ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﭘﺮﺳﻤﺎن ورودي اﺳﻨﺎد ttokenﻣﻲﺑﺎﺷﻨﺪ .ﻣﺸ ﺪه اﺳﺖ ﻛﻪ ﺷﺎﻣﻞ ﻛﻼسﻫﺎي زﻳﺮ اﺳﺖ : retrieval pدرر ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪ ﺪ .ﺑﺮاي اﻳﻦ ﻣﻨﻈﻈﻮر package ﻣﺮﺗﺒﻂ ﺑﺎزﻳﺎﺑﻲ ﻣﻲﺷﻮﻧﺪ اﻃﻼﻋﺎت 40324 ت ﭘﺮوژه دوم – ﺑﺎزﻳﺎﺑﻲ ﭘﻴﺸﺮﺮﻓﺘﻪي ﻧﻴﻴﻤﺴﺎل اول 92-91 ﻣﺪرس :ﺳﻠﻴﻴﻤﺎﻧﻲ ﻞ 10 :دي 91 ﻣﻮﻋﺪ ﺗﺤﻮﻳﻞ - ﺪ ﺷﺎﺧﺺﮔﺬار ﭘﭘﺮوژهي اول ،اﺳﺳﻨﺎد را ﺷﺎﺧﺺﮔﺬاري ﻣﻲﻛﻨﺪ .. :Indexerاﻳﻦ ﻛﻼس ﻣﺎﻧﻨﺪ - ﺐﺳﺎزي اﺳﻨﺎد ﺨﺶ ﺑﺮاي ﻣﺮﺗﺐ ﻦ ﻛﻼس ﻣﺴﺌﻮل ﺑﺎزﻳﺎﺑﻲ اﻃﻼﻋﻋﺎت ﺗﺮﺗﻴﺐدار اﺳﺖ .در اﻳﻦ ﺑﺨ :Ranked_Retreivalاﻳﻦ دو ﺣﺎﻟﺖ زﻳﺮﺮ را در ﻧﻈﺮ ﺑﮕﻴﻴﺮﻳﺪ : :cosine .aﻣﺤﺎﺳﺒﻪ ﺷﺒﺎﻫﺖ ﭘﺮﺳﻤﺎن و ﺳﻨﺪ از ﻣﻌﻴﺎر ﻛﺴﻴﻨﻮس زاوﻳﻪﻪ ﺑﻴﻦ ﺑﺮداري ) tf‐idfﻣﺪل ي ,در ﻓﻀﺎي ﺨﺶ ﻣﻲﺗﻮاﻧﻴﺪ ازز ﻛﺪ ﭘﺮوژه اول اﺳﺘﻔﺎده ﻧﻤﺎﻳﻴﺪ . ﺪ .ﺑﺮاي اﻳﻦ ﺑﺨﺶ (lnc.ltcاﺳﺘﻔﺎده ﻧﻤﺎﻳﻴﺪ ﻞ از ﭘﺮﺳﻤﺎن ﺑﺎ ﻛﺴﻴﻨﻮﺳﻲ ﺑﺨﺶ ) (aو ﻣﻣﻌﻴﺎر PaggeRankﻛﻪ ﻣﺴﺘﻘﻞ ﻲ :combﺣﺎﻟﺖ ددوم ﺗﺮﻛﻴﺒﻲ از ﻣﻣﻌﻴﺎر bined .b اﺳﺖ . ﻦ ﺻﻔﺤﺎت ﻣﺤﺎﺳﺳﺒﻪ ﻣﻲﺷﻮد ،ﺖ ﺗﻮﺟﻪ ﺑﻪﻪ ﻟﻴﻨﻚﻫﺎي ﺑﻴﻦ ﻋﺎت را در ﺟﺪاوول ﭘﺎﻳﮕﺎه داده ذذﺧﻴﺮه ﻛﻨﻴﺪ .اﻃﻃﻼﻋﺎﺗﻲ ﻛﻪ در د .ذﺧﻴﺮه اﻃﻼﻋﺎت در دﻳﻳﺴﻚ :در اﻳﻦ ﭘﭘﺮوژه ﺑﺎﻳﺪ ﻳﻚ ﺳﺮي از اﻃﻼﻋﺎ اﻳﻦ ﺟﺪاول ذﺧﻴﺮه ﻣﻲﻛﻛﻨﻴﺪ ﺷﺎﻣﻞ دو ددﺳﺘﻪ اﺳﺖ: - ﻛﻪ ﻳﻚ ﺑﺎر ﭘﺲ از ﺷﺎﺧﺺﮔﺬااري ،اﻃﻼﻋﺎت ﺬاري اﺳﺖ .ﺑﻪ اﻳﻦ ﺗﺮﺗﻴﺐ ﻪ ﻼﻋﺎت ﻣﺮﺑﻮط ﺑﻪ ﺷﺎﺧﺺ ﮔﺬ دﺳﺘﻪي اول اﻃﻼ ﺷﺷﺎﺧﺺ در ﭘﺎﻳﮕﺎه داده ذﺧﻴﺮه ﻣﻣﻲﺷﻮد و در زﻣﺎﺎن ﺑﺎزﻳﺎﺑﻲ ،اﻳﻦ اﻃﻼﻋﺎت از ﭘﺎﻳﻳﮕﺎه داده اﺳﺘﺨﺮﺮاج ﻣﻲﺷﻮد. - ﺑﺘﻮاﻧﻴﻢ ﺗﻌﺪاد زﻳﺎدي ﻢ ﻼﻋﺎت ﻣﺮﺑﻮط ﺑﻪ URLﻫﺎ درر ﺣﻴﻦ craawlingاﺳﺖ .ﻧﻤﻲﺗﻮان اﻧﺘﻈﺎر داﺷﺷﺖ ﻛﻪ دﺳﺘﻪي دوم اﻃﻼ وﻗﺖ ﻳﻚ ﺑﺎر در Uﻫﺎ ،ﻫﺮﭼﻨﺪ ﺖ ﺴﺖ ﻣﺘﻦ اﺳﻨﺎد و ﻟﻴﺴﺖ URL ﻨﻴﻢ .ﺑﻠﻜﻪ ﻣﻲﺑﺎﻳﺴ ﺻﻠﻲ crawlﻛﻨﻴ ﺻﻔﺤﻪي وب را در ﺣﺎﻓﻈﻪي اﺻ ﺻ ﺣﺣﺎﻓﻈﻪي ﭘﺎﻳﮕﺎه دداده ذﺧﻴﺮه ﺷﻮﻮﻧﺪ ﺗﺎ ﺣﺎﻓﻈﻪي اﺻﻠﻲ ﺑﺮاي اداﻣﻪي craawlingﺧﺎﻟﻲ ﺷﻮد .ﭘﺲ از اﺗﻤﺎم ) crawlﻣﺜﻼً ﻲﺷﻮﻧﺪ . ي وارد ﻣﺮﺣﻠﻪي Indexingﻣﻲ رﺳﻴﺪن ﺑﻪ ﺣﺪاﻛﺜﺜﺮ ﺗﻌﺪاد ﺳﻨﺪ ﻣﻣﻮرد ﻧﻈﺮ( ،اﻳﻦ ﺳﻨﺪﻫﺎي ﺑﺮاي ﺷﺎﺧﺺ ﮔﺬاري ﺪه اﺳﺖ . در ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪ ي اﻳﻦ ﻣﻨﻈﻮر ر ﺶ ﭘﻴﺎدهﺳﺎزي DataBasse packageﺑﺮاي در ﺑﺨﺶ ﺠﻮ ﺑﺎﺷﺪ و ﺷﻤﺎ (buttonﺟﺴﺘﺠ ﻦ ) (textboxو ﻳﻚ دﻛﻤﻪ )n ﻞ ﻳﻚ ﻗﺎب ﻣﺘﻦ ه .واﺳﻂ ﻛﺎﺎرﺑﺮي ﻣﺒﺘﻨﻲ ﺑﺮﺮ وب :واﺳﻂ ﻛﺎرﺑﺮي ﺑﺎﻳﺪ ﺷﺎﻣﻞ ﺖ )ج( ﺗﻮﺿﻴﺢ ي ﻛﻪ در ﻗﺴﻤﺖ ﺐ ﻧﺰوﻟﻲ ﻣﻌﻴﺎري ﻟﻴﺴﺖ ااﺳﻨﺎد ﻣﺮﺗﺒﻂ ﺑﺎ ﻛﻠﻤﺎت ﭘﺮﺳﻤﺎﻧﻧﻲ ﻛﻪ در ﻗﺎب ﻣﺘﻦ وارد ﺷﺪههاﻧﺪ را ﺑﻪ ﺗﺮﺗﻴﺐ ت ده ﺗﺎﻳﻲ ﻧﺸﺎن دﻫﻴﺪ(. ﻲ را در ﺻﻔﺤﺎت ﻲ ﺗﻮاﻧﻴﺪ ﺧﺮوﺟﻲ ﺪ ،در ﺧﺮوﺟﻲ ﻧﻧﺸﺎن دﻫﻴﺪ )ﻣﻲ داده ﺷﺪ ﻣﺮﺗﺒﻂ ﺑﺎ ﭘﺮﺳﻤﺎن واارد ﺷﺪه را ﺑﻪ ﻂ ت را در ﻛﻨﺎر ﻫﻫﻢ ﻗﺮار داده و ﺻﻔﺤﺎت ﺨﺘﻠﻒ ﺳﻴﺴﺘﻢ ﺑﺎزﻳﺎﺑﻲ اﻃﻼﻋﺎت درر ﻧﻬﺎﻳﺖ ﺑﺎﻳﺪ ﺑﺘﺘﻮاﻧﻴﺪ اﺟﺰاي ﻣﺨ ﺧﺮوﺟﻲ ﻧﺸﺎن دﻫﻴﺪ. ﻲ ﺗﺮﺮﺗﻴﺐ در اﻃﻼﻋﺎت 40324 ت ﭘﺮوژه دوم – ﺑﺎزﻳﺎﺑﻲ ﭘﻴﺸﺮﺮﻓﺘﻪي ﻧﻴﻴﻤﺴﺎل اول 92-91 ﻣﺪرس :ﺳﻠﻴﻴﻤﺎﻧﻲ ﻞ 10 :دي 91 ﻣﻮﻋﺪ ﺗﺤﻮﻳﻞ ﮔﺰﺰارش ﻫﻤﭽﻨﻴﻦ ﮔﺰارش ﻋﻤﻠﻜﻜﺮد ﺳﻴﺴﺘﻢ را ﻧﻴﺰ ﺗﺤﻮﻳﻞ دﻫﻴﻴﺪ .در ﻗﺴﻤﺖ ﻦ ﻴﺴﺘﻢ و ﻼوه ﺑﺮ ﻛﺪ ﺑﺮﻧﺎﻣﻣﻪ ﺑﺎﻳﺪ ﻣﺴﺘﻨﺪات ﻃﺮاﺣﻲ ﺳﻴﺴ درر اﻳﻦ ﭘﺮوژه ﻋﻼ ﺪه را ﻣﻌﺮﻓﻲ ﻧﻤﻤﺎﻳﻴﺪ .ﻫﻤﭽﻨﻴﻦ در ﻣﻮرد ﻧﺤﻮه ﻃﺮﺮاﺣﻲ ﺑﺎﻳﺪ ﻣﻌﻤﺎﺎري ﻛﻪ ﺑﺮاي Crawlerrدر ﻧﻧﻈﺮ ﮔﺮﻓﺘﻪاﻳﺪ و داده ﺳﺎﺧﺘﺎرﻫﻫﺎي اﺳﺘﻔﺎده ﺷﺪ ﺗﺮﻛﻴﺐ PageRankﺑﺎ ﻣﻌﻴﺎر ﺷﺒﺎﻫﻫﺖ ﻛﺴﻴﻨﻮﺳﻲ ﺐ ﺤﺎﺳﺒﻪ ،PageeRankﺳﺎﺧﺘﺎرﻫﻫﺎي درﻧﻈﺮ ﮔﺮﻓﻓﺘﻪ ﺷﺪه ﺑﺮاي اﻳﻦ ﻣﻨﻈﻮر و ﻧﺤﻮهي ﻣﺤ ﻛﻨﻴﺪ و ﻣﻘﺎﻳﺴﻪاي ﺑﺑﻴﻦ ﺑﺎزﻳﺎﺑﻲ ﺑﺮ ﺪه را ذﻛﺮ ﺪ ﺻﻠﻲ Crawlerﭘﻴﺎدهﺳﺎزي ﺷﺪ ﺤﺪودﻳﺖﻫﺎي اﺻ ﮔﺰارش ﻋﻤﻠﻜﺮد ،ﻣﺤ ش ﺗﻮﺿﻴﺢ دﻫﻴﺪ .درر ﻗﺴﻤﺖ اﺳﺳﺎس ﻣﻌﻴﺎرﻫﺎي ﻣﻄﺮح ﺷﺪه در ﺑﺨﺶ ج اراﺋﻪ ﻧﻤﺎﻳﻴﺪ. ﻣﻮﻓﻖ ﺑﺎﺷﻴﺪ
© Copyright 2026 Paperzz