構造情報を用いた情報検索 沖電気工業株式会社 1 概要 オントロジー(情報構造の定義)を利用して、 Web情報をキーワードに合った形に整理して表示する 検索結果 沖電気 ニュース 見出し 日付 内容 新製品・・・ 2003.7.9 ・・・ 製品情報 製品名 分類 特徴 仕様 ABC123 ソフトウェア ・・・ ・・・ イベント 情報 タイトル 日時 場所 ××セミナー 2003.9.11 国際展示場 企業情報 名称 所在地 決算 沖電気工業 東京都・・・ ・・・ インターネット 検索対象 選択 情報 抽出 情報 整理 オントロジー イントラネット 情報技術に関するオントロジーを用意し、 各種モジュール動作のための背景知識として利用 2 1 モジュール構成 ブラウザ システム 外部サービス キーワード入力 リソース検索 オントロジー 辞書 Web情報 サービス検索 検索エンジン Webサービス 情報分類 属性抽出 情報統合 情報出力 3 オントロジーの利用 1.Webページから検索対象ページの選択 ⇒ 検索精度の向上 例)イベント情報検索時は、イベント情報Webサービスから検索 2.ページの情報タイプにあった情報抽出 ⇒ 情報抽出精度の向上 例)ページ内に出現する日付をニュース、イベントなどの日付として 正しく認識 3.検索結果の体系的出力 ⇒ 情報の関連が明確になり、他の情 報との連携も容易 例)Webサービスで提供される企業情報と最新の決算情報との連 携 4 2 オントロジー辞書 技術 イベント 技術名 イベント名 技術解説 主催 イベント 日程 上位下位関係 上位下位関係 製品 知識処理 ニュース オントロジー セミナー 研究会 開催場所 分類クラス 分類ルール イベント ・・・ ・・・ ・・・ 講演情報 オントロジー 技術解説 ・・・ イベント SWO研究会 関連概念 建物 キーワード クラス・インスタンス 技術名 場所 住所 分類クラス−属性項目 オントロジー 製品 属性名 属性値タイプ イベント名 イベント 見出し語 *1 組織名 名 称,・・・ 主催 主催 ・・・ ◎ ・・・ ・・・ ・・ ・ イベント名 第4回SWO研究会 主催 人工知能学会 日程 学術総合センター 開催場所 2003年11月21日 セマンティックWeb キーワード オントロジー,・・・ 建物 学術総合センター 住所 東京都千代田区・・・ 5 属性抽出ルール 属性名 属性値のタイプ 見出し語 *1 イベント情報 イベント名 イベント 名称,イベント名 主催 組織名 主催 開催開始日 日付 開催地 ◎ 日時,日程,開催日時,開催日程 場所,会場,開催会場 場所情報 郵便番号 郵便番号 住所 住所 施設名 施設名,組織名 〒 企業情報 会社名 本社所在地 社長 組織名 所在地,本社 社長,代表取締役社長 所在地,本社 ◎ (*1) その属性には見出し語が必須ならば◎. 6 3 デモ画面例 参考:<企業><組織>の 時の出力属性 7 4
© Copyright 2024 Paperzz