オントロジー構築入門 - 大阪大学 産業科学研究所 駒谷研究室

日本図書館研究会 整理技術研究グループ月例研究会
オントロジー構築入門
よりよいオントロジー構築のための考え方と指針
大阪大学産業科学研究所
溝口研究室
古崎 晃司
[email protected]
講演概要
„
„
„
„
2006/11/18
1)オントロジー
2)オントロジーの利用法
3)オントロジー構築入門
4)よりよいオントロジー構築のためのガイドライン
日本図書館研究会 整理技術研究グループ月例研究会
2
1
1)オントロジー
„
„
„
オントロジー研究の背景
オントロジーの定義と役割
オントロジーの構成
„„
講演概要
講演概要
1)オントロジー
1)オントロジー
„„ 2)オントロジーの利用法
2)オントロジーの利用法
„„ 3)オントロジー構築入門
3)オントロジー構築入門
„„ 4)よりよいオントロジー構築
4)よりよいオントロジー構築
のためのガイドライン
のためのガイドライン
„„
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
3
1)オントロジー
オントロジー研究の背景
„
情報社会の発達
„
情報技術の発達・ネットワークの普及
→システムの相互運用性(知識の共有・再利用性)
の向上が望まれる
„
知識の共有・再利用における問題
„
形式に関する問題
„
„
内容に関する問題
„
„
2006/11/18
ファイル形式,文字コードなどの相違…など
同じものが別の名前で呼ばれる
同じ名前が別の概念を表す…など
日本図書館研究会 整理技術研究グループ月例研究会
4
2
1)オントロジー
知識の共有・再利用における問題
例)複数のシステム間での顧客名簿の共有
同じ顧客の氏名が別の名前で呼ばれている
システムA
顧客名:山田太郎
システムB
得意先:山田太郎
連絡先:
・住所:茨木市美穂ヶ丘…
・電話:06-5222-3111
連絡先:
・住所:高槻市赤大路町…
・電話:0726-99-1192
(↑自宅の住所・電話)
(↑勤務先の住所・電話)
同じ名前が示す概念が暗黙的に異なる
使用されている語彙や,暗黙となっている本質的な概念
の明示が必要→オントロジー
2006/11/18
5
日本図書館研究会 整理技術研究グループ月例研究会
1)オントロジー
オントロジーの定義と役割
„
オントロジーの定義
„
„
人工システムを構築する際の構成要素として用いら
れる基本概念/語彙の体系(理論)
オントロジーの役割
„
„
語彙や暗黙的な概念など,知識ベースを構築する際
の背景情報を提供する
オントロジーに基づいた知識ベースの構築
•知識の記述を容易にする
•構築された知識が一貫性をもつ
•他人が記述した知識の理解に役立つ
•知識の変換に貢献する
知識ベース
(モデル)
Î知識の共有・再利用に貢献 オントロジー
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
6
3
1)オントロジー
オントロジーの構成
„
対象世界を説明するのに必要な「概念」と,
概念間の「関係」から構成される
「乗り物」のオントロジー
移動空間
乗り物種
陸上
陸上車
航空機
海上
空
・・・
・・・
属性
バイク
4輪自動車
ジェット機
重量
定員
馬力
プロペラ機
バス
スポーツカー
機能
人を運ぶ
2006/11/18
構成物
物を運ぶ
エンジン
シャーシ
・・・
日本図書館研究会 整理技術研究グループ月例研究会
7
2)オントロジーの利用法
„
„
オントロジーの利用法
オントロジーの種類
„
„
„
„
意味的構成要素による違い
オントロジー利用形態の分類
オントロジー応用事例の分析
事例紹介
„„ 講演概要
講演概要
1)オントロジー
1)オントロジー
„„ 2)オントロジーの利用法
2)オントロジーの利用法
„„ 3)オントロジー構築入門
3)オントロジー構築入門
„„ 4)よりよいオントロジー構築
4)よりよいオントロジー構築
のためのガイドライン
のためのガイドライン
„„
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
8
4
2)オントロジーの利用法
オントロジーの利用法
„
オントロジーを利用が注目されている分野
„
„
„
„
情報分野: Semantic Web,知識管理,情報管理
工学分野:設計,教育,材料,化学
その他:医療,バイオ,ゲノム,法律
オントロジーの利用法
„
„
利用するオントロジーの種類
オントロジーの利用形態
の2つの観点から捉えることができる
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
9
2)オントロジーの利用法
オントロジーの種類
„
意味的構成要素による分類
„
„
„
„
„
„
哲学的な考察の深さによる分類
„
„
„
„
„
これら分類基準の組合せに
より,
「ライトウェイトオントロジー」
vs.
「ヘビーウェイトオントロジー」
と区別されることがある.
情報論的な利用効率を重視
哲学的な考察に基づき対象世界を適切に
捉えることを重視
その他の分類基準
„
2006/11/18
0)統一された語彙集合/簡単なスキーマ
1)概念間のis-a関係に基づく階層
2)is-a以外の関係を含む
3)意味制約の公理的記述を含む
4)その他の強い公理を含む
オントロジーの規模
対象とする領域
オントロジーの構築手法
オントロジーの種類によって
処理できる内容が異なる
日本図書館研究会 整理技術研究グループ月例研究会
10
5
2)オントロジーの利用法
意味的構成要素による違い(1/2)
※用語をドキュメントなどのキーワードとして利用する場合
を例として考えると…
共通語彙なし(キーワードの自由記述)
„
同じ用語でも表記法が異なると同じと分からない
„
„
„
原付
=
原動機付
二輪車
自転車
⊇
マウンテン
バイク
≠
ドーピング
例) 「原付」と「原動機付二輪車」,「スクーター」
「クエンチ」と「急冷」
?
→使用する用語の統一(=共通語彙)が必要
語彙の統一のみ(単なる用語の列挙のみ)
„
用語間の関係性が分からない
„
„
„
?
例) 「マウンテンバイク」は「自転車」の一種である
「ドーピング」(半導体/スポーツ)
→用語の関係性を明確にする必要がある
ドーピング
必要な情報(知識)に正確にアクセスすること
ができない→知識の共有・再利用の低下
2006/11/18
半導体に
おける
?
スポーツ
における
11
日本図書館研究会 整理技術研究グループ月例研究会
2)オントロジーの利用法
意味的構成要素による違い(2/3)
„
共通語彙や同義語辞書を用意すると…
„
„
原付の同義語
・原動機付自転車
・スクーター
用語の表記揺れを吸収
語彙(概念)階層を用意すると…
<軽量(語彙レベル)オントロジー>
„
階層の上下を見ることで関連する情報が分
かる(検索範囲のハンドリング)
„
„
„
„
原付
例)
「自転車」について検索する際に「マウンテン
バイク」も同時に検索
「自転車」で検索して十分な結果を得られな
かった際に,検索範囲を気相法まで広げる
所属する階層を見ることで,大まかな意味の
違いを区別することができる
しかし,これでは十分な意味の違いを捉える
ことはできない.→より詳細な定義が必要
2006/11/18
=
原動機付
二輪車
車両
-自転車
-マウンテンバイク
自転車
半導体プロセス
-...
-ドーピング
ドーピング
日本図書館研究会 整理技術研究グループ月例研究会
⊇
マウンテン
バイク
スポーツ不正行為
-...
-ドーピング
≠
ドーピング
12
6
2)オントロジーの利用法
意味的構成要素による違い(3/3)
例1)is-a階層のみ
„
車両
is-a 二輪車
is-a 自動二輪
is-a 自転車
is-a 三輪車
is-a
…
各概念の意味の
違いは暗黙的
2006/11/18
„
例2)その他の関係を追加
車両
is-a 二輪車
→車輪の数 =2
is-a 自動二輪
→動力源 =エンジン
is-a 自転車
→動力源 =人
is-a 三輪車
→車輪の数 =3
is-a
…
各概念の意味の違い
が明示化される
13
日本図書館研究会 整理技術研究グループ月例研究会
2)オントロジーの利用法
オントロジーの利用形態の分類
知識モデル的利用法
0)辞書的な利用
メタデータ的利用法
自然言語処理技術における利用
1)共通語彙としての利用
キーワード解析
キーワード付加
2)インデックスとしての利用
Web検索用ディレクトリ 文献情報のタグ付け
3)データスキーマとしての利用
データベーススキーマ 文献DBの書誌情報
4)知識共有の媒体としての利用
参照オントロジーを用
いたマッピング
コミュニケーション支援
5)知識モデルの規約としての利用 知識ベースシステム
セマンティックウェブ
6)知識の体系化への利用
コンテンツの統合管理
知識の体系的管理
詳細は下記のWebサイトを参照(解説・分析結果が掲載されています)
http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_apps/
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
14
7
オントロジーの利用形態
„
0) 辞書的な利用
„
„
„
自然言語処理やテキストマイニングなどを行う際の辞
書としてオントロジーを用いる.
例)オントロジーを利用した検索システム,
文献のクラスタリングツール
1) 共通語彙としての利用
„
„
„
2006/11/18
知識の相互性を高めるために,知識を記述する際に
用いる共通語彙としてオントロジーを利用する.
それらの共通語彙は,検索のキーワードや,統計的
手法を用いた処理の対象など,様々な用途で用いら
れる.
例)ブログなどに用いられるキーワードの解析
メタデータを用いた検索サービスなどが上げられる.
日本図書館研究会 整理技術研究グループ月例研究会
15
オントロジーの利用形態
„
2) インデックスとしての利用
„
„
„
„
3) データスキーマとしての利用
„
„
„
2006/11/18
適切な情報へアクセスのためのインデックスとしてオント
ロジーを利用する.
体系の中における語彙の位置づけを明示的に利用する
点が1)の共通語彙としての利用と異なる.
例)自動リファレンスサービス
コンテンツ管理システム
Webサービス検索エンジン
DBなどに格納するデータの構造や値を規定する標準化
されたデータスキーマとしてオントロジーを利用する.
オントロジーをデータスキーマとして利用するメリットは,
その相互運用性や意味構造を用いた知的処理にある.
例)ゲノムデータベースにおける現象記述
RDFを用いた臨床データベースの高度化
日本図書館研究会 整理技術研究グループ月例研究会
16
8
オントロジーの利用形態
„
4) 知識共有の媒体としての利用
„
„
システム間,人間とシステム,あるいは人間同士の間で知識
の相互運用性を高め知識共有を実現する.
複数の知識を同一のオントロジー(参照オントロジー)と対応
付けることで変換やマッピングを行う手法や,複数のオントロ
ジーを直接比較する手法などがある.
例)データベーススキーマの変換
機能を中心とした設計知識の変換システム
異なる機能語彙体系のマッピング
参照オントロジー
知識 A
マッピング
知識
知識 B
変換・マッピング
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
17
オントロジーの利用形態
„
5) 知識モデルの規約
„
„
2006/11/18
オントロジーが提供する概念定義に基づいて構築さ
れたインスタンスモデルは,対象世界のオブジェクトを
表した知識モデルとして用いることができる.
„ オントロジーは知識モデルに対する規約を与える
メタモデルとして利用できる.
知識モデルには単なるデータに比べて柔軟な知識の
意味記述が求められる.
例)ソフトウェア開発支援
ゲノム分野におけるパスウェイの統一的記述
eラーニングにおけるオーサリングシステム
日本図書館研究会 整理技術研究グループ月例研究会
18
9
オントロジーの利用形態
„
6) 知識の体系化への利用
„
„
„
オントロジーの意味的構成要素は,知識の体系化・組
織化の核となる概念構造を提供する.
それらを用いることで,対象世界の知識を構成してい
る概念をオントロジーとして体系化し,その規約に基
づいて知識管理・運用を実現することができる.
1)~5)で述べてきたオントロジーの利用目的を総合
的に用いたものと位置づけることができる.
例)エンジニアリングデータを規定する統一モデル
[EPISTLEプロジェクト]
オントロジーに基づく機能表現
2006/11/18
19
日本図書館研究会 整理技術研究グループ月例研究会
2)オントロジーの利用法
オントロジー応用研究事例の分析
オントロジーの種類(意味的構成要素)
0)語彙
オントロジーの利用形態
0)辞書的
1)共通語彙
1)is-a
1
1
11
4)知識共有
5)モデル規約
1
2
2
2)インデックス
3)データスキーマ
2)関係
1
1
1
2
3
9
1
3)意味制約 4)強い公理
2
1
9
1
4
4
5
3
12
4
1
4
1
7
1
6)体系化
合 計
1
1
18
18
45
15
1
合計
3
4
21
3
7
5
1
12
14
22
4
1
97
SIG-SWO資料(http://www.jaist.ac.jp/ks/labs/kbs-lab/sig-swo/ )
J-Stage(http://www.jstage.jst.go.jp/ )およびに公開されている文献を分析した結果
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
20
10
2)オントロジーの利用法
事例1)技術文書共有システム
Funnotation
Schema
(OWL)
(Funnotation)
function
is-a
プロパティ概念
take out
selected
way
way
rdfs:type
Metadata
(RDF)
selected
#取り出す
way
HTML
Document
#濾過
取り出す
selected
way
#精製する
#蒸留
精製する
濾過
装置
濾過 書
の文
蒸留
装置
蒸留 書
の文
検索クエリ
検索結果
アノテーター
システム利用者
法造、Jena、Tomcat、SPARQLを使って実装21
日本図書館研究会
整理技術研究グループ月例研究会
記述・提出
2006/11/18
2)オントロジーの利用法
事例1)技術文書共有システム
Funnotation
Schema
(OWL)
(Funnotation)
function
is-a
プロパティ概念
take out
selected
way
way
rdfs:type
Metadata
(RDF)
selected
#取り出す
way
HTML
Document
#濾過
取り出す
濾過
装置
濾過 書
文
の
#精製する
selected
way
#蒸留
精製する
蒸留
装置
蒸留 書
文
の
検索クエリ
検索結果
アノテーター
2006/11/18
システム利用者
法造、Jena、Tomcat、SPARQLを使って実装22
日本図書館研究会
整理技術研究グループ月例研究会
記述・提出
11
2)オントロジーの利用法
事例2)ナノテク知識の構造化
③ 構造化された知識の
記述システムとの連携
① コンテンツに含まれる
知識の全体俯瞰
プラットフォームの共通概念体系
としての軽量オントロジーを構築
Nanotech Index Ontology
共通概念体系に基づく統一的管理
知識ネットワーク
システム..etc.
要素知識の
構造化
Nanotech Index Ontology
(NIO)管理システム
構造化された
知識の記述
②関連するコンテンツの管理・相互移動
Web
Web Pages
Pages
Databases
Databases
Simulators
Simulators
Documents
Documents
プラットフォームに格納されたコンテンツ 群
2006/11/18
23
日本図書館研究会 整理技術研究グループ月例研究会
2)オントロジーの利用法:応用事例
詳細は『オントロジー工学』9章を参照
(溝口理一郎,オーム社,2005)
オントロジーに基づく工学知識の体系化
従来の知識ベース・知識工学
デバイスオントロジー
Agent, 対象物
デバイス(agent), 導管,
流れるもの(対象物), 媒体
対象
固有層
選択・具体化
汎用機能分解木
汎用機能分解木 方式特性木
方式特性木
視点依存
知識層
結合
機能モデリング
振る舞いと機能
メタ機能と機能タイプ
機能分解
• 方式と方法
一般
知識層
視点依存構造化
各機能の達成方式知識
各機能の達成方式知識
達成関係の記述
一般
概念層
機能概念
機能概念
オントロジー
オントロジー
参照
部品
部品
ライブラリ
ライブラリ
物理原理・
物理原理・
法則知識
法則知識
機能概念の具体化
知識のモデリング
Is-a 階層:機能と方式
Part-of 階層(is-achieve-by):機能
2006/11/18
対象の機能モデル
対象の機能モデル
デバイス・オントロジー
デバイス・オントロジー
基盤
概念層
日本図書館研究会 整理技術研究グ
ループ月例研究会
装置中心の観点からの特殊化
トップレベル・オントロジー
トップレベル・オントロジー
24
12
2)オントロジーの利用法:応用事例
オントロジーに基づく機能メタデータと変換
機能概念オントロジー
機能
オントロジー
(スキーマ/
タグセット)
FMEAオントロジー
機能オントロジー
エネルギー機能
移す
取る
除く
与える
加熱する
is-a
both
FTAオントロジー
通す
伝える
変換する
オントロジー
マッピング
移す
タスク依存オントロジー
機能
メタデータ
(RDF記述)
(1)装置の機能
インゴットを切断する
“分離する”
“分離する”
“除く”
“除く”
“摩擦力方式”
“摩擦力方式”
(2)機能の達成方式
線状摩擦方式
ワイヤーと
インゴットを
押し合わせる
ワイヤーを
動かす
熱を
除去する
ローラ方式
(3)装置の拡張機能モデル
自動変換
(タスク適応)
変換されたFMEAチャート例
アノテーション
Web
ドキュメント
(HTML記述)
2006/11/18
既存ドキュメント
日本図書館研究会 整理技術研究グ
既存FMEA
ループ月例研究会
25
3)オントロジー構築入門
„
„
„
「法造」におけるオントロジーの表現
オントロジー構築の一般的な手順
オントロジーの構築手順
„
„
„
„
is-a階層の構築
各概念の意味定義
制約の記述
インスタンスの生成
„„
講演概要
講演概要
1)オントロジー
1)オントロジー
„„ 2)オントロジーの利用法
2)オントロジーの利用法
„„ 3)オントロジー構築入門
3)オントロジー構築入門
„„ 4)よりよいオントロジー構築
4)よりよいオントロジー構築
のためのガイドライン
のためのガイドライン
„„
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
26
13
3)オントロジー構築入門
オントロジー構築・利用環境「法造」
オントロジー(=“法”)の構築・利用 (= “造” )を支援する環境
変更通知/
追従支援
Tracking
Panel
構築(
/修正)
オントロジー
エディタ
参照
ほう【法】
ほう【法】(『広辞苑』より引用)
(『広辞苑』より引用)
・物事の普遍的なあり方。物事をする仕方。
・物事の普遍的なあり方。物事をする仕方。
オントロジー
また、それがしきたりになったもの。
また、それがしきたりになったもの。
マネージャ
・社会生活維持のための支配的な規範。
・社会生活維持のための支配的な規範。
・真理。道理。正しい理法。存在の法則性。
・真理。道理。正しい理法。存在の法則性。
オントロジー間の
・ものの性質。特性。属性。
・ものの性質。特性。属性。
関係管理
・存在するものの分類。カテゴリー
・存在するものの分類。カテゴリー
オントロジーサーバー
オントロジー・モデル構築者
参照・組込
概念工房
言語処理系
支援
オントロジー
他の知識
システム
モデル
(オントロジー構築
ガイドシステム)
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
27
3)オントロジー構築入門
「法造」のオントロジーエディタ
ナビゲーションペイン
オントロジーの全体像(is-a階層)
の表示,検索などを行う.
Browsing Panel
オントロジーをグラフィカル
に表示・編集する.
定義ペイン
選択した概念の定義内容を
表示・編集する.
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
28
14
3)オントロジー構築入門
「法造」で扱うオントロジー
„
オントロジーの構成
„
„
対象世界を説明するのに必要な「概念」
概念間の「関係」
動物
ほ乳類
„
概念定義の内容
„
„
„
„
„
犬
猫
ラベル(,コメント)is-a関係 秋田犬 土佐犬
上位概念/下位概念
サイズ:26×2.3
自転車
色:
赤
部分概念 part-of関係
サドル 変速:24段変速
ハンドル
属性 attribute-of関係
前輪
その他の制約
・前輪とハンドルは
その他の関係
連動している.
2006/11/18
・前輪≠後輪
日本図書館研究会 整理技術研究グループ月例研究会
29
3)オントロジー構築入門
「法造」のオントロジー表現
„
„
概念:ノードで表現
関係
„
„
„
„
詳細は,
『オントロジー構築入門』
(2章)を参照
is-a関係:is-aリンクで表現
part-of関係:slot(p/o)で表現 ※ロール概念を伴う
attribute-of関係:slot(a/o)で表現
その他の関係:関係リンクで表現
ノード
概念を表す
is-aリンク
is-a関係を表す
スロット(p/o)
part-of関係を表す
関係リンク
スロット間の関係を表す
スロット(a/o)
attribute-of関係を表す
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
30
15
3)オントロジー構築入門
オントロジー構築の一般的手順
„
オントロジーの利用目的・範囲の決定
„
„
再利用可能なオントロジーの検討
„
„
再利用可能な既存オントロジーがあれば利用する.
オントロジーの構築
„
„
„
„
利用目的によって必要とされるオントロジーの種類
(定義の詳細さ,規模など)が変わるので,構築を始
める前に明確にしておく.
is-a関係を用いた階層化
各概念の意味定義
その他の制約の記述
オントロジー構築の中心
オントロジーの利用(インスタンスモデルの作成)
„
構築したオントロジーを利用して,知識モデル(インス
タンスモデル)を記述する.
[参考文献]“Ontology Development 101:A Guide to Creating Your First Ontology”
(Natalya F. Noy and Deborah L. McGuinness )
2006/11/18
31
日本図書館研究会 整理技術研究グループ月例研究会
3)オントロジー構築入門
is-a関係を用いた階層化
„
上位-下位(is-a)関係(sub-class-of,a-kind-of関係)
„
「下位概念(クラス)は上位概念(クラス)の一種である」ことを表す.
„
„
„
„
„
例)自転車 i s-a 二輪車,人間 i s-a ほ乳類
下位概念のインスタンス集合は上位概念のインスタンス集合の部分集
合となる.
例)全ての自転車は,二輪車である.
上位概念の性質は,下位概念に継承される.<性質の継承>
is-a関係に基づく階層
„
「世界にあるものはどのように分類されるか」を表し,オントロジーの主
要な構成要素となる.
二輪車クラス
例)二輪車のis-a階層
自転車クラス
自転車#1
(二輪車#1
でもある)
インスタンス
2006/11/18
自動二輪車クラス
二輪車#2
日本図書館研究会 整理技術研究グループ月例研究会
自動二輪車#1
(二転車#3
でもある) 32
16
3)オントロジー構築入門
is-a階層構築の基礎的指針
„
オントロジーにおけるis-a階層の特徴
対象世界における概念の性質をできるだけ反映したものであることが
のぞまれる.
→オントロジーにおけるis-a階層は「単なる語彙分類階層(taxonomy)」
ではない.
„
„
is-a階層構築(クラス分類)の推奨基準
„
基本的な考え方
„
„
上位概念から「どのような性質が継承されるか?」を意識する.
同じ上位概念を持つ下位概念同士の「違い」を明確にする.
„
クラス分類基準の同一性
„
インスタンス集合のパーティション性
„
„
„
„
is-a階層を構築する(下位概念を定義する)時の基準(視点)は一定にする.
下位概念間のインスタンス集合の重なりを避ける.
本質的な属性による分類(何を本質とするかは恣意的)
分類の上下関係
„
„
„
2006/11/18
分類観点に従属性があればそれに従う.
一般性の高い性質は上位概念で定義する.
多重継承の利用はできるだけ避ける.
詳細は,
『オントロジー構築入門』
(3章)を参照
日本図書館研究会 整理技術研究グループ月例研究会
33
3)オントロジー構築入門
is-a階層構築の基礎的指針
„„ „ オントロジーにおけるis-a階層の特徴
インスタンス集合のパーティション性
クラス分類基準の同一性
対象世界における概念の性質をできるだけ反映したものであることが
„
のぞまれる.
パーティションではない場合
パーティションである場合
分類基準が混在した例
→オントロジーにおけるis-a階層は「単なる語彙分類階層(taxonomy)」
クラスC1
クラスC3
クラスC1
ではない.
サブクラスC3
„
車輪の数による分類
クラスC2
is-a階層構築(クラス分類)の推奨基準
„
基本的な考え方
„ 上位概念から「どのような性質が継承されるか?」を意識する.
移動場所による分類
サブクラスC2
サブクラスC2,
C3 の
„ 同じ上位概念を持つ下位概念同士の「違い」を明確にする.
サブクラスC2, C3
ど ち らにも属さない
„ クラス分類基準の同一性
の両方に属するイ
C1のインスタンス
„ is-a階層を構築する(下位概念を定義する)時の基準(視点)は一定にする.
ンスタンス
分類基準を整理し直した例
„ インスタンス集合のパーティション性
パーティションではないis-a階層の例
中間概念を追加
„
„
„
„
„
„
2006/11/18
下位概念間のインスタンス集合の重なりを避ける.
本質的な属性による分類(何を本質とするかは恣意的)
排気量による分類
車輪の数による分類
分類の上下関係
分類観点に従属性があればそれに従う.
移動場所による分類用途による分類
一般性の高い性質は上位概念で定義する.
多重継承の利用はできるだけ避ける.
日本図書館研究会 整理技術研究グループ月例研究会
34
17
3)オントロジー構築入門
is-a階層構築の基礎的指針
„
„
オントロジーにおけるis-a階層の特徴
クラス分類基準の同一性
対象世界における概念の性質をできるだけ反映したものであることが
„
のぞまれる.
分類基準が混在した例
→オントロジーにおけるis-a階層は「単なる語彙分類階層(taxonomy)」
ではない.
„
車輪の数による分類
is-a階層構築(クラス分類)の推奨基準
„
基本的な考え方
„
„
上位概念から「どのような性質が継承されるか?」を意識する.
移動場所による分類
同じ上位概念を持つ下位概念同士の「違い」を明確にする.
クラス分類基準の同一性
„ is-a階層を構築する(下位概念を定義する)時の基準(視点)は一定にする.
分類基準を整理し直した例
„ インスタンス集合のパーティション性
„
中間概念を追加
„ 下位概念間のインスタンス集合の重なりを避ける.
„
„
本質的な属性による分類(何を本質とするかは恣意的)
車輪の数による分類
分類の上下関係
„
„
„
分類観点に従属性があればそれに従う.
移動場所による分類
一般性の高い性質は上位概念で定義する.
多重継承の利用はできるだけ避ける.
2006/11/18
35
日本図書館研究会 整理技術研究グループ月例研究会
3)オントロジー構築入門
概念の意味定義
„
概念定義の必要性
„
„
„
is-a階層だけでは概念間の意味的な違いは不明確
概念のラベルは,人間には意味があるが,計算機には理解不可能
意味定義に用いる基本的な関係
„
part-of関係(全体-部分関係,has-part)
„
„
ものが複数の部分から構成されていることを表す.
part-ofとhas-partは本来は別の意味を持つ(後述).
„
„
„
例)二輪車の意味定義
ものに強く結びついている性質(属性)を表す.
„
„
例)車輪part-of 二輪車
attribute-of関係(属性)
例)重さ attribute-of 二輪車
クラス制約
関係に対する制約
„
個数制約(カーディナリティ:cardinality)
„
„
„
クラス制約
„
2006/11/18
その関係を持つ数に関する制約
n..m(n以上m以下)の形で表される.
その関係を持つインスタンスが所属する
クラスに関する制約
個数制約
日本図書館研究会 整理技術研究グループ月例研究会
36
18
3)オントロジー構築入門
意味定義の継承の利用
„
意味定義(性質)の継承
上位概念の意味定義は下位概念に継承される.
„
„
継承された意味定義の特殊化
継承された意味定義は,下位概念で特殊化することができる.
„
„
継承・特殊化を適切に用いることで概念間の意味の違
いを明確にすることができる
意味定義の継承
継承された定義の特殊化
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
37
3)オントロジー構築入門
その他の制約の記述
„
その他の関係を用いた制約の記述
„
その他の関係を用いることで,
意味定義の制約を表現できる.
„
„
例)二輪車のハンドルは車輪と
連動している
→ハンドルと車輪の間には
連動関係が成立する
述語論理などを用いた公理記述
„
„
推論規則(AならばB:A→B)などを表す述語論理を用い
ることで,計算機を用いた推論に利用するより厳密な意
味定義(公理)を記述することができる.
このような公理記述はできるだけ避ける.
„
„
2006/11/18
整合性のある記述の困難さ,可読性の低下を招く恐れがある.
is-a,意味定義,その他の関係を用いた意味制約(これらも公理
の一部である)で多くのオントロジーは表せると思われる.
日本図書館研究会 整理技術研究グループ月例研究会
38
19
3)オントロジー構築入門
インスタンスの生成
オントロジーの利用
„
„
„
構築されたオントロジーに基づいてインスタンスモデル
を記述することができる.
インスタンスは,オントロジーにおける意味定義に沿っ
て生成される.
自転車のインスタンス
インスタンスの生成
オントロジーにおける
自転車の意味定義
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
39
4)よりよいオントロジー構築
のためのガイドライン
„
„
„
全体と部分の相互依存性
ロール概念
典型的な誤り例
„„
講演概要
講演概要
1)オントロジー
1)オントロジー
„„ 2)オントロジーの利用法
2)オントロジーの利用法
„„ 3)オントロジー構築入門
3)オントロジー構築入門
„„ 4)よりよいオントロジー構築
4)よりよいオントロジー構築
のためのガイドライン
のためのガイドライン
„„
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
40
20
4)オントロジー構築のガイドライン
全体と部分の相互依存性
„
全体の部分依存性
„
全体となる概念は,部分の集合として定義され
例)「自転車」は,「車輪」,「ハンドル」,「ペダル」などの部分から構成
される
„
部分の全体依存性
„
部分となる概念は,全体から定義される
„
„
例)「車輪」は,「自転車」(全体)の部品である.
全体から独立した部分の定義
„
部分となる概念は,他の箇所で定義された概念を参照して
定義される
„
„
2006/11/18
例)「車輪」が「自転車」(全体)の部分となるときは「自転車車輪」と
なり,「自動二輪」(全体)の部分となるときは「自動二輪車輪」となる.
→「自転車」や「自動二輪」で共通して使える「車輪」と,それぞれで
しか使えない「自転車車輪」,「自動二輪車輪」がある.
41
日本図書館研究会 整理技術研究グループ月例研究会
4)オントロジー構築のガイドライン
法造における全体-部分の表現
„
全体の部分依存性
„
„
部分の全体依存性
„
„
part-ofスロット(関係)を用いた
概念の意味定義
part-ofスロット(関係)の定義
全体をコンテキストとした
ロール概念としての扱い
全体から独立した部分の定義
„
クラス制約による参照
全体に依存した「部分」の定義
2006/11/18
クラス制約
による参照
part-of関係を用いた
自転車の意味定義
日本図書館研究会 整理技術研究グループ月例研究会
全体から独立して
定義された概念
42
21
4)オントロジー構築のガイドライン
part-of関係に伴うロール概念
„
「車輪」と「前輪」の違いは?
車輪 part-of 自転車
„
„
車輪は単独でも車輪→全体から独立した部分の定義
前輪 part-of 自転車
„
„
自転車から外れたら前輪でなくなる→部分の全体依存性
「前輪」は単なるラベル(呼び名)?
„
„
概念的な情報量は増えているので,「前輪」は 「車輪」を
より詳細化した概念と考えられる
それでは,「前輪」 is-a 「車輪」?
„
„
„
前輪と車輪は概念的な性質が異なる
全体依存性(ロール概念) vs 全体独立性(基本概念)
2006/11/18
43
日本図書館研究会 整理技術研究グループ月例研究会
4)オントロジー構築のガイドライン
法造におけるロール概念の扱い
ロール概念
„
„
ある“もの”が特定のコンテクスト(全体など)
のもとで果たす役割を捉えて概念化したもの
クラス制約
„
„
詳細は,
『オントロジー構築入門』
(4章)を参照
部分ロール概念で定義された役割を担う概念に関する規約(別
の箇所で定義された基本概念かロールホルダーを参照)
ロールホルダー
„
„
ロール概念で定義された役割を担った状態の概念
車輪
「クラス制約」が参照している概念(基本概念)が
「ロール概念」で定義された役割を担った状態が
「ロールホルダー」 前輪ロール
前輪
コンテキスト
となる全体
ロール概念
クラス制約
ロールホルダー
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
44
22
4)オントロジー構築のガイドライン
法造におけるロール概念
基本概念
„
„
他の概念に依存せずに定義される概念
例)人間,男性,車輪,など
ロール概念
„
„
„
ある“もの”が特定のコンテクストのもとで果たす役割を捉えて概念
化したもの
例)夫としての役割(夫role),妻role
教師としての役割(教師role),看護婦role
役割を担うことができる基本概念をクラス制約で指定
ロールホルダー
„
„
ロール概念で定義された役割を担った概念
例)夫,妻,教師,看護婦
ロール概念
クラス制約
ロールホルダー
2006/11/18
ロール概念の記述法
日本図書館研究会 整理技術研究グループ月例研究会
45
4)オントロジー構築のガイドライン
ロール概念の例
„
山田太郎さん(30才:男性)は千里高校で教師をしている.
5年前に花子さんと結婚して夫婦となり,今は既に2人の
子供の父親でもある.また週末には英会話学校に通学し
例の問題:ロール概念を用いると…
ている生徒でもある.
基本概念「人間(男性)」のインスタンス「太郎」が
コンテクスト に応じて ロール概念
„
„
„
„
2006/11/18
高校では…………教師role
夫婦においては…夫role
家庭では…………父親role
英会話学校では…生徒role
を担った
ロールホルダー
となる
ロール概念を導入することで,コンテクストに応
じた概念の変化を明確に扱うことが可能に
日本図書館研究会 整理技術研究グループ月例研究会
46
23
4)オントロジー構築のガイドライン
ロール概念定義の詳細
ロール概念
ロールホルダー
教師role
教師
R2-1)年齢(>22)
R2-2)担当教科
基本概念(クラス制約)
人間
B1,R1) 年齢
B1 ,R1)名前
R2-2)勤続年数
B2)身長
B2)体重
基本概念 :B1)ロール概念から参照される/ B2)ロール概念から参照されない
ロール概念:R1)基本概念の定義を参照
R2-1)参照している定義に制約追加/R2-2)ロール概念で新たに追加
ロールホルダー:上記を合わせたもの
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
47
4)オントロジー構築のガイドライン
ロール概念の性質
„
ロール概念のコンテクスト依存性
1)ロール概念のインスタンスは,特定のコンテクストに依存して具
体化される
例) 「教師role」のインスタンスは 「学校」のインスタンス によっ
て定まるコンテクストに依存して具体化される.
2)コンテクストが無くなると,ロール概念のインスタンスも消滅する
例)「学校」が廃校になると,それに伴い
「教師role」のインスタンスも無くなる.
千里高校
×
2)
1)
コンテクストを定める概念に依存
(千里高校の)
ロールを担う
×
教師role
ロール概念「教師role」
のインスタンス
2006/11/18
(千里高校の)
教師
太郎
基本概念「人間」の
インスタンス
ロールホルダー
日本図書館研究会 整理技術研究グループ月例研究会
48
24
4)オントロジー構築のガイドライン
ロールホルダーの性質
„
ロールホルダーが消滅する3種類のパターン
1)「太郎」が死ぬと(=人間のインスタンスが消滅)
„ 「教師」は消滅するが, 「教師role」は空きポストとして残る
2) 「太郎」が教師を辞めると(=ロールを担うことを止める)
„ 「教師」は消滅するが, 「教師role」は空きポストとして残る
„ 「人間」のインスタンス(太郎)はそのまま存続
3) 「教師role」が無くなると(=ロール概念のインスタンスの消滅)
„ 「教師」は消滅するが,「人間」(太郎)はそのまま存続
2)×
1)×
3)× (千里高校の)
ロールを担う
太郎
教師role
ロール概念「教師role」
のインスタンス
2006/11/18
基本概念「人間」の
インスタンス
(千里高校の)
教師
ロールホルダー
49
日本図書館研究会 整理技術研究グループ月例研究会
4)オントロジー構築のガイドライン
二種類の継承の利用
„
„
is-a関係に基づく上位概念から下位概念への継承
クラス制約からロール概念への継承 詳細は,
『オントロジー構築入門』
上位概念
①上位概念から下位概念
への継承・特殊化
②上位概念から下位概念へ
継承されているが,特殊化
はされていないので,ブラ
ウジングペイン上では下
位概念のスロットとして
表示ない
(4.3.2項)を参照
下位概念
クラス制約
として参照
③クラス制約から
ロール概念への継承
④継承されない
スロット
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
50
25
4)オントロジー構築のガイドライン
典型的な誤り例(1)
„
不適切な多重継承の利用
①is-aとpart-of関係の混同
②ロールとの混同
詳細は,
『オントロジー構築入門』
(4.3.3項)を参照
①’part-of関係を用いた正しい記述例 ②’ロール概念を用いた正しい記述例
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
51
4)オントロジー構築のガイドライン
典型的な誤り例(2)
„
is-a関係とpart-of関係,部分概念とロールの混同
詳細は,
『オントロジー構築入門』
(6.2節)を参照
基本概念ではなくロール
part-of関係に伴う
ロール概念として定義
is-a関係ではなくpart-of関係
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
52
26
4)オントロジー構築のガイドライン
典型的な誤り例(3)
行為の記述
„
自然言語による記述
のみで,意味定義が
十分に行えていない
概念間の関係を記述する
ことで,より意味を明確に
した定義(まだ不完全)
行為に関係する
概念を用いた定義
2006/11/18
詳細は,
『オントロジー構築入門』
(5.4,5.5節)を参照
日本図書館研究会 整理技術研究グループ月例研究会
53
まとめ
„
1)オントロジー
„
„
3)オントロジー構築入門
„
オントロジー研究の背景
一般的な構築手順
„
„
„
2)オントロジーの利用法
„
„
„
オントロジーの種類
オントロジー利用形態の分類
オントロジー応用事例の分析
„
„
„
is-a階層の構築
各概念の意味定義
制約の記述
インスタンスの生成
4)よりよいオントロジー構築
のためのガイドライン
„
„
ロール概念
典型的な誤り例
参考資料
„
„
„
„
「法造」公開サイト http://www.hozo.jp
オントロジー応用事例の分析
„ http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_apps/
「オントロジー工学」(著:溝口理一郎,オーム社,2005)
「オントロジー構築入門」
(著:古崎晃司,來村徳信,笹島宗彦,溝口理一郎,オーム社,2006)
2006/11/18
日本図書館研究会 整理技術研究グループ月例研究会
54
27