検索エンジンを使った論理式によるWeb情報検索(情報検索 レポート 2_2 の資料) 2004/05/07 高木 1. 論理式(AND, NOT)の練習 論理式(AND, OR, NOT )の練習 以下の 10 件の新聞記事見出しを使って以下の練習問題の検索式を作成し、想定される回答件数 を答えよ。 1:新型肺炎の死者香港で 100 人越す 中国大陸でも(毎日 2002/4/24) 2:北京の一部機能不全も SARS 感染拡大 (日経 2003/4/25) 3:新型肺炎北京も「渡航延期」外務省、危険情報引き上げ (毎日 2002/4/23) 4:北京“渡航延期勧告”新型肺炎(読売 2002/4/23) 5:中国共産党 北京の新型肺炎感染者数 8 倍超に修正 衛生相と市長更迭(毎日 2002/4/21) 6:SARS治療に快復者の血清療法が好成績 香港紙 (asahi.com 2003/05/05) 7:新型肺炎、死者は435人に(Yomiuri On Line 2003/05/05) 8:SARS患者の入院可能病院、250 施設・日経調査(Nikkei net 2003/05/05) 9:中国の感染者4千人を突破 北京の新型肺炎死者百人に 死亡率7%に迫る(kyodo i News 2003/05/05) 10:中国ロケできない公開延期 常盤映画 SARS が襲った(スポーツニッポン 2002/4/24) Q1 北京の SARS に関する記事の検索式を作れ A1 北京 and SARS Q2 北京の新型肺炎に関する記事の検索式を作れ A2 北京 and 新型肺炎 Q3 北京の SARS と新型肺炎に関する記事の検索式を作れ A3 北京 and(SARS or 新型肺炎) Q4 中国の SARS と新型肺炎に関する記事の検索式を作れ A4 中国 and(SARS or 新型肺炎) Q5 中国と北京の SARS と新型肺炎に関する記事の検索式を作れ A5 (中国 or 北京) and(SARS or 新型肺炎) Q6 全ての記事の検索式を作れ A6 SARS or 新型肺 Q7 北京の新型肺炎 SARS の感染に関する検索式を作れ A7 北京 and (新型肺炎 or SARS) and 感染 1件 (2) 3件 (4,5,9) 4件 (2,4,5,9) 4件 (1,5,9,10) 4件 (1,2,3,4,5,9,10) 10 件 3件 (2,5,9) 2. google を使った論理式による検索 Q1 北京の新型肺炎 SARS の感染に関する、日本語の検索式による検索を google で実行せよ。 A1:北京 and (新型肺炎 or SARS) and 感染を実行する。 1)検索オプションをクリックする 2)すべてのキーワードを含む → 北京 感染 フレーズを含む → 使用しない いずれかのキーワードを含む → 新型肺炎 SARS(スペースは英数半角) キーワードを含めない → 使用しない 3)件数の確認 (2003/05/05) 北京 10,800,000 件 北京 and 感染 131,000 件 北京 and 感染 and 新型肺炎 1,020 件 北京 and 感染 and 新型肺炎 and SARS 875 件 北京 and 感染 and (新型肺炎 or SARS) 4,230 件 4)google の論理式による表現(and が省略できる) 北京 感染 新型肺炎 OR SARS Q2 北京と香港の新型肺炎 SARS の感染に関する、 英語の検索式による検索を google で実行せよ。 A2:(北京 or 香港)and SARS and infection を実行する。 1)検索オプションによる方法 すべてのキーワードを含む → SARS infection 1 フレーズを含む → 使用しない いずれかのキーワードを含む → beijing hongkong(スペースは英数半角) キーワードを含めない → 使用しない 2)google の論理式による表現(and が省略できる) SARS infection beijing OR hongkong (OR は大文字) (フレーズ検索は”-- - --“) 3)件数の確認(2003/05/05) SARS and infection 17100 件 SARS and infection and beijing and hongkong 82 件 SARS and infection and (beijing or hongkong) 3130 件 Q3 新型肺炎 SARS の「感染の予防」に関する、検索式による日本語検索を google で実行せよ。 A3:(新型肺炎 or SARS) and 感染の予防 を実行する。 1)検索オプションによる方法 すべてのキーワードを含む → 使用しない フレーズを含む → 感染の予防 いずれかのキーワードを含む → 新型肺炎 SARS(スペースは英数半角) キーワードを含めない → 使用しない 2)google の論理式による表現(and が省略できる) 新型肺炎 OR SARS "感染の予防" (OR は大文字) 3. AltaVista を使った論理式による検索 Q3 AltaVista で Q2 と同様の検索を実行せよ。 A3:SARS and infection and (beijing or hongkong)を検索する。 1)advanced search をクリックする。 2) All these words → and 検索 the exact phrase → フレーズ 検索 any of these words → or 検索 and none of these words → not 検索 3)件数の確認 193 件(2003/05/05) 4.検索エンジンの詳しい説明 ・Yahoo(リスト方式) :階層的に並べられた Arts で始まる 14 のカテゴリーリストを順に選択(ク リック)する。最後に検索対象の WWW サーバへリンクが張られている。Search の右の advanced search をクリックすると論理式を使用したキーワード方式の検索も可能となるが、Yahoo の機能 を利用するためにはキーワードは基本的に1語とし、Yahoo の Categories を捜すために使用す るのが適当である。キーワードはスペースで区切って入力し検索は画面の指示(method を指定 する)に従い実行する。分類をカテゴリーと呼んでいるが実態はリストに近い。 Category Maches: Yahoo が独自に選んだ Web Site を Yahoo のカテゴリーに分類したもの。Yahoo の検索に最も効果的。1カテゴリー3万件程度になるよう選択している(今年の最大は business の4万件)。 Web Site Matches(Directories と名称変更 2003、Yahoo が選択した Web Site のこと): キー ワード検索の結果 Yahoo が独自に選んだ Web Site と一致するサイト。使う価値があると判断し たページでなくサイトを検索の対象としていることが Yahoo が使いやすい最大の理由となって いる。 Web Page Matches:Google の結果と同じ。Yahoo を使う意味は特にない。 ・google(キーワード方式): リンクが多く張られているページを上位に出力するため一般に良く使用されるページを見つけ ることができる。キーワード方式の中では非常に使いやすい。入力窓の右にある Preferences(指 示 設 定 ) を ク リ ッ ク し Inteface Language( 表 示 言 語 の 設 定 ) を English に 指 定 し Save Preferences( 保 存 ) す る と 英 語 検 索 が 可 能 に な る 。 Japanese( 日 本 語 ) を 指 定 し Save Preferences(保存)すると日本語検索が可能になる。Advanced Search(検索オプション)で論理式 2 による検索が可能になる。and 検索 は with all of the words、or 検索は with at least one of the words、not 検索は without the words にキーワードをスペースで区切って入力する。 語 の順序を指定できるフレーズ検索も可能である。"kw1 kw2"でもフレーズ検索が可能である。ロ ボット型検索でも Yahoo に近い結果が得れるにもかかわらず Yahoo のような営利的な意図が入り にくい。英語検索の時のみ検索対象 Web ページ数が表示される。2002/5/5 日現在 2,073,418,204 ページが登録されていた。2003/5/5 日現在総ページ数は 3,083,324,652 ウェブページ、2004/5/7 日現在総ページ数は 4,285,199,774 ウェブページ。 ・msn (キーワード方式): Microsoft Corporation の MSN Web サイトの中にある検索エンジン。Advanced Search(条件検索) で簡単な論理式による検索ができる。絞り込みに地域や言語が利領できる。日本のサイトも存在 する。 ・HotBot(キーワード方式) :1996 年に登場し検索エンジンとしては後発であるが、そのため情 報量が多く、検索速度が早いなど、現在でも最高水準の検索エンジンである。niigata nuis の ようにキーワードの間にスペースを入れ、 SEARCH をクリックすると、niigata and unis の検 索となる。Advanced Search で Word Filter を使用すれば and, or, not 検索が可能になる。地 域、ページの位置指定の検索も可能である。 ・AltaVista (キーワード方式) :Degital Equipment Corporation が運営しており、記事の収 集能力は現状で最も高く、検索も良い結果が得られる場合が多い。niigata nuis のようにキー ワードの間にスペースを入れ、SEARCH をクリックすると niigata or nuis の結果が出る。 +niigata +nuis で、niigata and nuis で、niigata and nusi 検索になる。search の右の Advanced Search をクリックすると、論理式 Boolean query の検索が可能となる。呼び出した画面にキーワードを AND, OR を使用して入力する。例えば niigata and nuis と入力して Search をクリックすると Web Pages 283 pages found と結果が表示される。必要なものをクリックすると、対象の WWW ページ へリンクする。the Web の代り Usenet を選択するとニュースが検索できる。 ・goo(キーワード方式):1997 から利用可能なNTT(関連会社)による日本語の代表的なサ イト。[ 検索設定 ] をクリックすると and 検索、or 検索、フレーズ検索、not(除外する)検索 が可能な画面となる。 ・alltheweb :Advanced Search により and, or, not を使った論理検索が可能になる。タイトル 中と文章中の言葉を区別した and (Must include), not(Must not include)検索も可能である。 5.使用する検索エンジン 同じ課題で、①∼④の計 4 検索エンジンを使用してください。 日本検索エンジン リ ス ト ( カ テ ①必ず使用 英語検索エンジン Yahoo Japan ③必ず使用 Yahoo ゴリ-)方式 Google キーワード 方式 ④右の5検索エン ②右の 4 検索エン goo ジンから 1 つを使 ジンから 1 つを使 msn search 用 用 alltheweb Google AltaVista HotBot msn search alltheweb 検索エンジンリストは高木のトップページの WWW 検索エンジン一覧 List of Search Engins を参照してください。 3
© Copyright 2024 Paperzz