構造情報を用いた情報検索 - セマンティックWeb委員会

構造情報を用いた情報検索
沖電気工業株式会社
1
概要
オントロジー(情報構造の定義)を利用して、
Web情報をキーワードに合った形に整理して表示する
検索結果
沖電気
ニュース
見出し
日付
内容
新製品・・・
2003.7.9
・・・
製品情報
製品名
分類
特徴
仕様
ABC123
ソフトウェア
・・・
・・・
イベント
情報
タイトル
日時
場所
××セミナー
2003.9.11
国際展示場
企業情報
名称
所在地
決算
沖電気工業
東京都・・・
・・・
インターネット
検索対象
選択
情報
抽出
情報
整理
オントロジー
イントラネット
情報技術に関するオントロジーを用意し、
各種モジュール動作のための背景知識として利用
2
1
モジュール構成
ブラウザ
システム
外部サービス
キーワード入力
リソース検索
オントロジー
辞書
Web情報
サービス検索
検索エンジン
Webサービス
情報分類
属性抽出
情報統合
情報出力
3
オントロジーの利用
1.Webページから検索対象ページの選択 ⇒ 検索精度の向上
例)イベント情報検索時は、イベント情報Webサービスから検索
2.ページの情報タイプにあった情報抽出 ⇒ 情報抽出精度の向上
例)ページ内に出現する日付をニュース、イベントなどの日付として
正しく認識
3.検索結果の体系的出力 ⇒ 情報の関連が明確になり、他の情
報との連携も容易
例)Webサービスで提供される企業情報と最新の決算情報との連
携
4
2
オントロジー辞書
技術
イベント
技術名
イベント名
技術解説
主催
イベント
日程
上位下位関係
上位下位関係
製品
知識処理
ニュース
オントロジー
セミナー
研究会
開催場所
分類クラス
分類ルール
イベント
・・・
・・・
・・・
講演情報
オントロジー
技術解説
・・・
イベント
SWO研究会
関連概念
建物
キーワード
クラス・インスタンス
技術名
場所
住所
分類クラス−属性項目
オントロジー
製品
属性名
属性値タイプ
イベント名
イベント
見出し語
*1
組織名
名
称,・・・
主催
主催
・・・
◎
・・・
・・・
・・
・
イベント名 第4回SWO研究会
主催
人工知能学会
日程
学術総合センター
開催場所
2003年11月21日
セマンティックWeb
キーワード オントロジー,・・・
建物
学術総合センター
住所
東京都千代田区・・・
5
属性抽出ルール
属性名
属性値のタイプ
見出し語
*1
イベント情報
イベント名
イベント
名称,イベント名
主催
組織名
主催
開催開始日
日付
開催地
◎
日時,日程,開催日時,開催日程
場所,会場,開催会場
場所情報
郵便番号
郵便番号
住所
住所
施設名
施設名,組織名
〒
企業情報
会社名
本社所在地
社長
組織名
所在地,本社
社長,代表取締役社長
所在地,本社
◎
(*1) その属性には見出し語が必須ならば◎.
6
3
デモ画面例
参考:<企業><組織>の
時の出力属性
7
4