Webサーチエンジン

サーチエンジン
理工学部知能情報システム学科 渡辺 義明
はじめに
インターネット上には極めて多様な情報が公開さ
れるようになってきました。有効に利用すれば強力
表
サーチエンジンの例
国内デ ィレクトリ型中心サービス
な情報取得手段になります。皆さんは、必要とする
または
ページへど
のようにして辿りついていますか。スタートページ
からリンクを辿ることだけでは、暇つぶしには良い
でしょうが必要ページへ到達することは困難です。
国内ロボット型中心サービス
必要とするページをすばやく探し出すにはサーチ
エンジン(検索エンジン)が便利です。この記事で
は、このサーチエンジンの使い方を概説します。
サーチエンジン
世界中に存在する
国内併用型サービス
ページの情報を収集整理
しておき、ユーザーからの問い合わせに対して該当
するページ一覧を提示するサービスが存在します。
これをサーチエンジンと呼びます。表
に国内外
の代表的なサーチエンジンの例を挙げます。これ以
外にも多数あります。また盛衰も激しいので、この
表はあくまでも執筆時点での代表例として理解下
さい。
海外デ ィレクトリ型中心サービス
情報の収集整理法によって、サービスは大きく二
種類に分かれます。一つは、
ページを分野 カ
テゴリ)別に分類して保存し、一覧表として提示す
海外ロボット型中心サービス
る形式のサービスです。ディレクトリ型(またはカ
テゴリ型)と呼びます。分類登録を行うのは、その
サービスの管理者および登録を希望するページの管
理者です。人手を介しますので、比較的整理された
情報が得られますが、情報の量は少なくなります。
もう一つは、
ページの情報をロボットと呼
ばれる自動プログラムで定期的に自動収集してデー
タベースに保存しておき、キーワード を用いた問い
合わせに対して、データベースから該当ページを探
し出して提示するサービスです。ロボット型と呼び
ます。こちらは情報の収集から検索まで全自動で行
海外併用型サービス
いますので、未整理ですが大量の情報が手に入りま
ワインのフルボデ ィとは何の事か知りたい。
す。これを狭義のサーチエンジンと呼ぶこともあり
家計の可処分所得の年次推移を、佐賀と全国で
ます。
比較したい。
アルゴリズムの実装プログラム
デ ィレクト リ型の例としては 、下図の
があります。提示されたカテゴリ分類項目
を探したい。
を選択することにより、その分野のより細かい分類
項目が表示されます。また、キーワード で登録情報
を検索することもできます。誰もが興味を持つよう
「サーチエンジンについて知りたい」
な一般的な情報であり、そのカテゴリ分類項目が存
在する場合は、有用な情報を効率良く得ることがで
きます。しかし、特殊な情報を得ようとすると情報
不足になります。
誰もが関心を持つようなキーワード の場合は、デ
ィレクトリ型のサーチエンジンで試すことを薦めま
す。カテゴリ分類項目と一致すれば整頓された一覧
が手に入ります。ここでは、まず、
で「サーチエンジン」と指定して検索してみます。
やはり、該当するカテゴリ分類項目がありました。
ロボット型では、入力窓に入れたキーワード を元
に収集した情報を検索します。特殊なものでも探せ
ますが、その反面一般的なキーワード の場合には余
りに多数のページが提示され戸惑うことになりま
す。この時は複数のキーワード を組み合わせて絞り
込む必要があります。
表 は、どちらの方式を中心にしているかで分類
しています。しかし、各サイトとも両方のサービス
を徐々に融合してきていますので、この分類は大体
そこから辿れば、サーチエンジンの使い方や評
価、比較などのページを見ることができます。
の目安と考えてください。
検索の実例
一般的に述べても分かりにくいので、ここでは具
体的な探索要求例について見ていきましょう。以下
「イッキ飲みの危険性について知り
たい」
これも、まずは
で「イッキ飲み」の
キーワード で探してみます。
の例は、一般的な事から特殊な事へ順に並べてい
ます。
サーチエンジンについて知りたい。
イッキ飲みの危険性について知りたい。
カテゴリ分類にはありませんが、防止の活動をし
ている団体のページが見つかりました。
なら説明がありそうです。しか
し、これを選択すると、ページが見つからないとの
しかし一つだけしか見つからなかったので、今度
メッセージが表示されました。
はロボット型のサーチエンジンとして代表的な
で探してみます。
このような場合は別の候補ページを当たることに
なります。しかし、この例の場合には、各種ワイン
銘柄の味のページが殆どであり、確かにフルボディ
件余りが見つかりました。少し多
と言う用語は使っているのですが、それ自体の説明
いので、その中でも切実な死亡事故を扱ったものに
ここでは、
はなかなか見つかりません。そこで先ほどのペー
絞ることにします。キーワード を複数指定して、そ
ジに戻り、
れらを両方とも含むページを検索します。
ページを見てみます。
その結果、
(アド レス の末尾を削って上位の
件が見つかりました。
すると該当ページは、無くなったのではなく、他
「ワインのフルボディとは何の事か
知りたい」
へ引っ越したことが分かりました。
ページの構
成はその管理者によって少しずつ変更が加えられて
います。該当ページは名前やリンク構造上の位置が
この例では、サーチエンジン
で、
二つのキーワード を指定して探してみましょう。
変えられただけかもしれません。末尾を削ってトッ
プページに近いところから辿りなおせば見つかるこ
とがあります。
「家計の可処分所得の年次推移を、佐
賀と全国で比較したい」
結果として得られたページ一覧の最初に、
なるタイトルのページがあります。なお
これはキーワード の選択が難しい例です。どの
このサーチエンジンでは、関連キーワード 追加や類
キーワード も一般的で、多数のページと一致しま
ができることが図か
す。ここでは、さまざまな入力方式が提示される
似ページ検索
ら分かります。
で調べてみます。
ジを探す場合、キーワード の前に半角のプラス記
号を付け半角スペースで区切って並べます。単にス
ペースで区切ると、与えたキーワード の「いずれ
か」を含むページを探します。
該当ページが長文の場合、キーワード がそのペー
ジのどこに含まれているか分からないことがありま
す。この時には、
ブラウザのメニューにある
「ページ内検索」の機能を使うと便利です。
キーワード をいろいろ組み合わせても期待する
ページがなかなか得られません。このような場合は
良いキーワード を思いつけるかどうかが鍵です。今
回は「統計」をキーワード に加えることが成功に結
びつきました。
今回も、可能性の高い候補ページが長文であった
上の入力で佐賀のデータが得られ、
「佐賀」を除
き「全国」を入れれば、全国版のデータが得られま
ため「
」をページ内検索し、周辺を拾い
読みして見つけました。
した。両者とも解析に使えるデータ形式が取得でき
ました。
検索のヒント
「
アルゴリズムの実
装プログラムを探したい」
最後は特殊な情報を探す例です。殆どの人には何
複数のキーワード を組み合わせて指定する場合、
それらキーワード の全てを含むとする
型の指
定と、いずれか少なくとも一つ以上のキーワード を
含むとする
型の指定とが良く使われます。要
型でいくつもキーワード を並
の興味も無い情報でも、自分が有用と思うなら、世
は、多すぎれば
界中には同じように有用と考えている人がいるか
べて絞り込み、少なすぎれば
もしれません。ここでは、私自身の研究に必要なコ
ればよいことになります。また、あるキーワード を
ンピュータプログラムを探してみました。この情報
含まないとする
は海外にある可能性が高いため、ロボット型で有名
ん。絞り込み途中で目障りな項目が目立って来た場
な海外サイト
を使うことにしました。表
題中のキーワード を並べただけでは候補が多すぎて
有用情報に辿りつけません。このような場合には、
型で範囲を広げ
型もありますが余り使いませ
合などに利用します。
表 にこれらの指定方式を例示しています。多く
のサーチエンジンでは、
のどちらの指定
様々な追加キーワード を試してみることになりま
かを、キーワード 入力窓の傍にある「全ての語 い
す。結局、このプログラムを適用する最適化問題の
ずれかの語」のようなメニュー選択で指示します。
名称「
」を加えることで絞り込めました。
メニュー選択がなく、キーワード の前にプラス記
号(半角)が付けば、そのキーワード は必ず含まな
ければならず、単にスペースではいずれか一つ以上
を含めば良いことを表す場合もあります。マイナス
記号(半角)の付いたキーワード を含むページは一
では、
「全て」のキーワード を含むペー
覧から除かれます。他にも様々な指定方式がありま
表
複数キーワード の組み合わせ例(詳しくは各サーチエンジンの
サーチエンジン キーワード「
」、
「
」
キーワード「
」、
「
」
の例
をともに含むと指定
のいずれかを含むと指定
を参照)
キーワード「
み「
」を含
」を含まずと指定
いくつかのエンジンは
全ての語を含む
いずれかの語を含む
拡張機能等で対応
他多数
他
の
パワーサーチ
等の拡張機能
の
エキスパート
検索
すが、これら指定方式はサーチエンジンによって少
しずつ異なりますので、それぞれのサーチエンジン
上で使用方法を確認してください。
さらに、サーチエンジンによっては、括弧を使っ
見つからない場合
ロボット型( または併用型)サーチエン
ジンを利用する。
た優先順位付けや、キーワード が互いに近くにある
たくさんのキーワード を
ことの指定、キーワード が表題やリンク名など特定
てみる。
の場所にあることの指定、画像など特別の形式であ
キーワード を短くしてみる。または、分
ることの指定なども可能です。
割してみる。
検索の成否は、キーワード の選択に大きく依存し
ます。目的の情報にベストマッチするキーワード を
思いつけば成功です。最初の検索で提示された候補
ページをいくつか見ていくと追加すべきキーワード
が鮮明になってきます。また関連キーワード を提示
してくれるサーチエンジンもあります。
該当するページが多すぎたり少なすぎたりした場
合には以下のような手段があります。
接続で並べ
同義語、類義語、略語、広義概念の用語
などに変えてみる。
サーチエンジンを変えてみる。
検索対象を日本から全世界に広げる。
各サーチエンジンで検索方法が微妙に異なります
ので、あまり浮気せずに少数のサーチエンジンを使
い慣れることが良い様に思います。
多すぎる場合
デ ィレクトリ型( または併用型)サーチ
エンジンを使う。
ロボット型では、たくさんのキーワード
を
上の様々な情報
例えば以下のような情報が
から手に入りま
す。サーチエンジンで探してみてください。
接続で並べてみる。
「リンク集」などをキーワード に追加し
て、関連情報の要約ページを探す。
サーチエンジンを変えてみる。
地図、郵便番号、電話番号、航空機・宿な
どの予約状況・受付、文献検索・取り寄せ、
英和・和英辞書検索、本の検索・購入、特
許情報、乗換案内、時刻表、審議会報告・
答申、統計データ、図書館蔵書検索、オン
ラインジャーナルなど
また、以下のようなサイトも情報検索には便利で
しょう。自分に合うものを探してみてください。
リンク集を集めたページ。例えば「リンクのリ
ンク」などで、探してください。サーチエンジ
ンとは、また違った便利さがあります。
サーチエンジンを集めたページ。「 メタサー
チ」などで探してください。複数のサーチエン
ジンを利用する検索ページなどもあります。
おわりに
上には人間の興味あることはなんでもある
と言える状況になってきました。例えば、あるペー
ジ(アリアド ネ)は、心理学、言語学、教育学、政
治学、経済学等、学術分野毎に分類整理したリンク
集であり、調査研究に役立つリサーチツールとなっ
ています。また、あるページ(
)では
もの学術雑誌の目次を無料で検索することが可能で
す。多くの図書館からリンクがあります。
上の情報は日々更新されており、今日便利
なページが明日もそうであるとは限りません。必
要となった時点で便利なページを探すことが肝要
であると考えて、この記事では具体的
アド レ
ス はサーチエンジンのみに限りました。上のペー
ジへは、文章中のキーワード を組み合わせれば辿り
つけると思います。サーチエンジンで探して見ませ
んか。