博 士 (情報科学) 浅 野 優 学位論文題名

博 士 ( 情報 科 学 )
学位論文題名
浅野
優
Vocabulary Building h/Iechanism based on Lexicographic
Semantics:EOrQueryingtheSemantlCWeb
(セマンテイックWebに対する問合せのための辞書的意味論に基づく語彙構築機構)
学 位 論 文 内 容の 要 旨
W
eb
りソースは,文書や画像,音楽,動画にとどまらず,ネットワークで繋がれたモバイル機器や電
化製品,環境の中に埋め込まれたコンピュータやセンサ―なども対象にする動きがある.今後もこ
の動きが加速し,様々なものがWe
b
を介してアクセス可能になり,今以ヒに多くのりソースがW
e
b
上に存在することが予想される,そこで,それらの膨大なW
eb
リソースを効率的に利用するための
方法 として ,We
bりソ ースの 意味内 容情報を用いた検索を可能とするセマンティックW
eb
の実現
があ る.そ のた めの研 究は現 在も惑 んにおこをわれており,Wo
r
l
dW
i
dc
W
bb
C
on
s
om
u
mの′3C
)を
中心に園際的な標準化が進められている,その標準には,W
めりソースの意味内容情報の記述のた
めの構文であるR
es
o
uルe
D
e丘nj
t
io
n
Fr
a
me
w
or
k
,R
DF
の記述に用いられる語彙を定義し,意味内容
を記 述する ため のR
DF・s
che
ma
,0
WL
we
bon
to
lo
gy
l曲gua
ge
,リソース間の推論規則を記述する
ためのS
emant
icWも b
RuleL
angu
ag
e,問 合せの ため のS
B`RQ
LPr
ot
oc
01a
nd
RD
FQ
眦f
yL
ang
ua
ge
(S
PA
R
Q
L)がある.他にも,W
ぬりソース間の関係記述のための語彙D
u
b
li
n
C
o
r
e
や人の関係記述の
ための記述語彙F
t
〕‘A
F
など意味内容情報の記述のための語彙が定義されている,また,定義した語
彙を 用いて W
ik
ipe
di
aのデ ータを 構造化したD
B
p
ed
i
aやコンピュータサイエンス分野の学術的出
版物 のデー タを 構造化 したDB
LPB
ib
li
og
rap
hy
が あり, 両者と もSW
凪Q
Lを用い た問合せも可能
であるっまた,これらのデータを繋ごうとするLi
n
k
e
d
Da
ぬという試みもあり,膨大を量のりソース
から 成るセ マン ティッ クWめ実現 の動きがある.セマンティックW曲技術が有用されている例に
は,R
j
ch
S
it
c
Su
m
ma
r
yを剛いたニュースサイトやW
め口グがあり,タイトルや更新日時,要約など
の情報をりソースに付加することで内容情報による検索を可能にし,更新日時が新しい記事や要約
にあるキーワードを含む記事の収集を機械処理により自動化できる,
意味内容に基づぃたW
めりソース検索が可能となる環境が整いつっある一方で,検索に用いられ
るW3
Cが提 案する 提案 問合せ 言語SP
ARQ
Lの使用 には ,クラスやプロパティ,変数の知識が必須
であ り,それ らに関 する知識 のない一 般的ユ ーザによ る使用 は困難である.
本研究では,セマンティックW
めに対して,拡張可能で再利用性の高い辞書的意味論に基づく語
彙(辞書的語彙)を定義し,その語彙を用いた問合せ言語とその評価機構を提案することにより,上
記の 問題を 解決するための理論的基盤とをる研究を行った.本研究における成果は以下の2点で
ある.
1.セマ ンティ ック W
めに 対す る問合 せのた めの辞 書的 意味論 に基づ く語彙 構築機構の提案
2
.1
の機構によって定義された語彙を用いた問合せ言語の提案
本論文の構成は以下の通りである,第1
章では,本研究の背景や動機,貢献について記す.第2
章
では.セマンティックW
めにおけるW
めりソースの意味内容記述のための語彙の定義言語と,セマ
ンティックWぬに対する問合せ言語の研究について解説するとともに,それらにおける問題点を提
起する.第3章では,本研究の基盤とをるセマンティックWめに基づぃた辞書的意味論について解
- 701―
説 し , 辞書的 語彙 の基と なる 基本語 彙の 定義に つい て示す .基 本語彙 は、 セマン テイ ックWebにおい
て 定義 されて いる プ口パ ティ やクラ スに マッピ ング して定 義さ れる,
第 4章 で は , 辞 書 的意 味 論に 基づぃ て定 義した 辞書 的語定 義言 語LexicographicWordDefinition
Language(LWDL)を 用 い た 語 彙 構築 機 構 を 提 案 す る, こ の 語 彙 構築 機構 により ,第 3章で 定義し た
基 本語 彙を基 に, 派生語 彙を 定義す るこ とで, 語彙を拡張することができる.提案手法では,既定義語
の 組 み 合 わ せ に 新た な ラ ベル を与え るこ とで, その 新たな ラベ ルを新 たな 派生語 とし て定義 する こ
と がで きる, 例え ば,「 ParentJと 「Male」とい う話 が存在 する 時,それらの積の組み合わせ「Par
ent
andMale」に 対し て新た なラ ベル「 Father_lを与え,新たな語「fathe
r亅を定義することができる.こ
の よう な語彙 の拡 張によ り, 「Parent andMale」 という 語の 組み合わせ表現の代わりに,直観的で短
い 表現 「Father_lを用い て表 現する こと ができ る, また, 語彙 の要素 には ,自然 言語における名詞と
形 容詞 と動詞 があ り,こ れら を組み 合わ せて複 雑を 対象を 表現 するこ とが できる .動詞は,状態の記
述 と 状 態 の 変 更 の2っ を 表す た め に 用 い ら れる こと が考え られ るが, 本論 文では 前者 を表す ため に
用 いる ことと する .
第 5章 で は , 辞 書 的語 彙 を用 いた問 合せ 言語QueryLanguage basedonLexicographicSemantics
(QLLS)の 構 文 を 示 す , 第4章 で定 義 し た 辞 書 的 語 彙に 含 ま れ る 名 詞 と形 容 詞 と 動 詞 を用 いた 語の
組 み 合 わ せ に よ り複 雑 な 対 象 を 表 現 する こ と が で き る ,第 6章 では ,第5章 で提 案する 間合 せ言語
QLLSで の問 合 せ の 評 価 機構 につ いて示 す, 提案評 価機 構は複 数の 書き換 え規 則から 成る ,それ らの
書 き 換 え 規 則 を 適切 な 順 に 適 用 す る こと で , 第 1に QLLS表 現 は 関 係 演 算 式に 書 き 換 え られ, 次に
関 係演 算式は 対応 するSPARQL表現 に書 き換え られ る.
第 7章 で は , 第 4章 ∼ 第 6章 で 示 した 提 案 手 法 を 組 み 合わ せ た シ ス テ ム を用 い て , セ マンテ ィツ
ク Webに 対 し て 辞 書 的語 彙 を 定 義 し , それ の 語 彙を用 いた 問合せ と, その問 合せ の評価 方法 につい
て 例 を 用 い て 示 す . 第 8章 で は 関 連 研 究 と の 比 較 に つ い て 述 べ , 第 9章 に 結 諭 を 示 す .
本 論 文 で な、 拡 張 可 能 で 再 利 用性 の 高 い 辞 書 的 意味 論 に 基 づ く 語 彙を セ マ ン テ ィ ック Webに対
す る 問 合 せ 言 語 に導 入 す る方 法を提 案す ること で, 語と語 の組 み合わ せに よる簡 便な 表現に よる 問
合 せを 実現し た, また, 一度 定義し た提 案語彙 は, 限られ た数 の基本 語彙 のみを 問合せ対象のセマン
テ ィ ッ ク Webに マ ッピ ン グ す る こ と で .マ ッ ピ ン グ し た セマ ン テ ィ ッ ク Webに 対す る 問 合 せ に 再
利 用す ること がで きる,
学位論文審査の要旨
主査
副査
副査
教授
教授
教授
田中
原口
有村
譲
誠
博紀
学 位 論 文題 名
V
ocab
ular
y Bu
ildin
g IV
Iech
anis
m ba
sedon Le
xico
grap
hic
S
eman
ticsforQ
uery
ingt
heSe
mant
lCWe
b
(セ マ ン テイ ッ ク W
ebに 対す る 問 合 せの た め の辞 書 的 意味 論 に 基づ く 語 彙構 築 機構)
近 年 , 膨大 な Web
り ソ ー ス を 効 率的 に 利 用 す るた め の 方 法 とし て , Web
り ソース の意 味内容 情報
を 用 い た検 索 を 可 能 とす る セ マ ン ティ ッ ク Web
が 提 案 さ れ ,WorldWideW
ebCo
ns
or
ti
um(W
3C
)
を 中 心 に国 際 的 な 標 準化 が 進 め ら れて い る , We
bリ ソース の意味 内容情 報の 記述の ための 構文で
あ る Re
sourc
e Def
initi
onFra
me
wo
rk(
RD
F)
に 用いら れる語 彙を 定義し 意味内 容を記 述す るため の
RDF
-sche
maと OW
L webonto
logylangu
age, リ ソー ス 間 の 推 論規 則 を 記 述 する た め の Se
manti
c
WebRuleLang
uage,間 合 せ の た め のSPARQ
L Pro
tocolandRDF Q
ueryLa
ng
ua
ge(S
PA
RQL
)が提
案 さ れ 普及 し つ っ あ る. さ らに ,定義 した語 彙を用 いて W
ik
ip
ed
iaのデー タを構 造化し たDB
pe
dia
や . コンピ ュー タサイ ェンス 分野の 学術的 出版 物のデ ータを 構造化 した D
BL
PBi
bli
og
ra
ph
yが既 に
構 築 さ れ 公 開 さ れ て お り , 両 者 と も SPARQLを 用 い て 問 合 せ 可 能 に を っ て い る .
意味 内 容 に 基 づ ぃた Webりソ ー ス 検 索 が可 能 と なる 環境が 整い つっあ る一方 で,検 索に用 いる
間 合 せ 言語 と し て W3
Cが 提 案 し てい る 提 案 問 合せ 言 語 SPA
RQLを 活用 す る に は ,ク ラ ス や プ ロパ
ティ 、変数 の知 識が必 須であ り。そ れら に関す る知識 のをい 一般ユ ーザ による 使用は困難である.
本研 究で は,セ マンテ ィック W
eb
に 対し て,拡 張可能 で再利 用性 の高い 辞書的 意味諭 に基づ く語
彙( 辞書的 語彙 )を定 義し, その語 彙を用いた間合せ言語とその評価機構を提案し,それらの意味論
の理 論的基 盤を 構築し ,実働 可能な システムの開発基盤を明確にしている,本研究における成果は以
下の 2
点 である .
1
. セ マ ン テ ィッ ク Webに対 する問 合せの ための 辞書的 意味 諭に基 づく語 彙構築 機構 の提案 と,
その 意味諭 の理 論的基 盤の構 築,
2.上記 の機 構によ って定 義され た語彙 を用 いるこ とが可 能を問合せ言語の提案と,上記の理論的
意味 論に基 づく 評価機 構の構 築.
本 論文の 構成は 以下の 通りで ある ,第1章で は,本 研究の 背景や動機,貢献について記している.
第 2章 では , セ マ ン ティ ッ ク Web
におけるW
ebリ ソ ースの 意味 内容記 述のた めの語 彙定 義言語 と,
セ マ ンティ ック W
eb
に 対する 問合せ 言語に 関す る従来 の研究 につい て解説 する ととも に,そ れらに
お け る 問題 点 を 提 起 して い る. 第3章では ,本研 究の基 盤とな るセ マンテ ィック W
eb
に 基づぃ た辞
書的 意味諭 の理 諭につ いて解 説し, 辞書的語彙の基となる基本語彙の定義法について示している,第
4章では 、辞書 的意味 論に 基づき 、辞書 的語定 義言 語を用 いた語彙構築機構を提案している,この語
彙構 築機構 によ り,第 3
章 で定義 した基 本語彙 を基 に,派 生語彙を定義することができ,これにより
語彙 を拡張 する ことが できる ,語彙 の要素には,自然言語における名詞と形容詞と動詞の別があり,
― 703―
これら を組み 合わ せて複 雑な概 念を表 現する こと ができ る.動 詞には ,状 態の記 述を表 す場合と状
態の更 新を表 す場 合があ るが, 本論文 では前 者の 場合の みが考 察の対象とをっている.第5章では,
辞書 的 語 彙 を用 いた 問合せ 言語の 構文が 示され てい る.第 4
章 で定義 した辞 書的語 彙に 含まれ る名
詞と形 容詞と 動詞 を用い た語の 組み合 わせに より 複雑な 対象を 表現することができる.第6章では、
第5章 で 提 案 され た 問 合 せ 言 語QLLSで記 述 さ れ た 問合 せ の 評価機 構が 示され ている ,評価 機構は
複数の 書き換 え規 貝I
亅 から成り,それらを適切な順に適用することで,Q
L
LS
表現は最初に関係演算式
に 書 き 換 え られ , 次 に 対 応す る SPA
RQL表 現 に書 き 換 え ら れる , 第 7章 では , 第 4章 ∼第 6章 で 示
した 提 案 手 法を 組み 合わせ て開発 された システ ムを 用いて ,セマ ンティ ック W
eb
に 対して 先ず辞 書
的語彙 を実際 に定 義し, その語 彙を用 いた問 合せと,その間合せの評価過程について例に即して説明
がなさ れてい る, 第8
章 では 関連研 究との 比較評 価が行 われ 、本研 究の優 位性が 示さ れている,第9
章には 結諭が 示さ れてい る,
こ れ を 要 する に,著 者は, 近年ま すま す普及 しつっ あるセ マンテ ィッ クW
ebに対す る使い 易く簡
便で柔 軟な検 索間 い合わ せ記述 を実現 するこ とを 目指し て,( 1
) セマン ティッ クWe
bに対する間合
せのた めの辞 書的 意味諭 に基づ く語彙 構築機 構と 、その 意味論 の理論的基盤,(
2
)このようにして定
義され た語彙 を用 いるこ とがで きる問 合せ言 語と ,理論 的意味 論に基 づく その評 価機構 に関する理
論的基 盤とシ ステ ム実現 法に関 して新 知見を 得た もので あり, ウェブ 工学 ならび に知識 工学に対し
て貢献 すると ころ 大なる ものが ある. よって 著者は,北海道大学博士(情報科学)の学位を授与され
る資格 あるも のと 認める ,
− 704一