センサの Linked Dataの作成・公開支援環境に関する研究

センサの Linked Data の作成・公開支援環境に関する研究
Supporting Environment to Create and Publish Linked Data of Sensor
分散システム学講座 0312012116 常木 翔太
指導教員: 児玉英一郎 王家宏 高田豊雄
1.
はじめに
近年,Linked Data に関する研究が盛んに行わ
れており,その1つとして,センサに関するデータ
を Linked Data にした Linked Sensor Data が知ら
れている.Linked Data とは,メタデータを記述
するフレームワークの1つである RDF(Resource
Description Framework)に従い記述されたデータ
のことで,2006 年に Tim Berners-Lee によって提
唱された概念である.また,Linked Sensor Data と
は,2008 年にアメリカのライト州立大学の Henson
らによって定義されたもので,センサに関する情報
を Linked data 化したものである.
センサに関する Linked Data 記述の枠組みと
しては,2007 年に Open Geospatial Consortium
(OGC)によって定義された SensorML や,2008
年に同 OGC によって定義された Observations and
Measurements などが知られており,多種多様な枠
組みが存在している.このように多種多様な枠組み
が存在すると取り扱いが複雑になるため,2009 年か
ら 2011 年にかけて,W3C の SSN-XG(Semantic
Sensor Network Incubator Group)によって SSN
(Semantic Sensor Neteork)Ontology が開発され,
勧告された.
この SSN を利用した Linked Data の普及状況に
ついて,データセットの検索機能を提供している
datahub.io で調査した結果,この SSN Ontology を
使用したデータセットは約 10,000 件中わずか 4 件
のみとなっており,現在のところあまり普及してい
ない状況となっている.
一方で,誰もが自由に利用,再利用,再配布でき
る形でデータを公開する Open Data が注目を集め
ている.海外の事例として,アメリカでは 2009 年
5 月にデータカタログサイト Data.gov が開設され,
航海図や地底地底地形図,ハリケーン情報などの
公共データが Open Data として公開されている.
国内の事例としては,福井県の鯖江市が “データシ
ティ鯖江” を目指し,Web ページで公開する情報を
積極的に RDF 化している.この Open Data の流
れに乗り Linked Data も普及していくことが期待
される.
しかし,センサのデータを Linked Data として
公開するためには,Linked Data の形式や,SSN
Ontology について学習する必要があり,企業また
は一般の人がデータを公開するには敷居が高い状
況となっている.そのため,半自動的にセンサの
Linked Data を容易に作成,公開できる環境が必要
であると考える.そこで,本研究では,半自動的に
センサの Linked data を作成,公開可能な支援環境
のモデルの提案を行う.
関連研究と問題点
2.
関連研究として,Zhang らの研究 1) ,Roussey ら
の研究 2) が知られている.Zhang らの研究では,セ
ンサに関する情報及び観測データに対し手動で独自
のメタデータを付与し,マッピングファイルを基に
SSN Ontology を利用した RDF に変換することで,
センサの Linked Data を作成している.Roussey ら
の研究では,センサに関する情報を手動で作成し,
観測データは,CSV 形式からテンプレートファイ
ルを基に RDF 形式に変換することによって,セン
サの Linked Data を作成している.
関連研究の問題点として,Zhang らの研究におい
ては,センサの Linked Data を作成する際に事前
にメタデータを付与しなければならない点が指摘で
きる.このメタデータは,Zhang らによって設計さ
れたものであり,センサの Linked Data を公開す
るユーザはこのメタデータの形式などを学習する必
要があるため,学習負荷が高い.また,Roussey ら
の研究では,依然センサに関する情報は手動で作成
する必要があるため,労力を伴う点が指摘できる.
このことから,両研究共に利用者の負担は高く,
センサの Linked Data を作成・公開する敷居は高
いままであるといえる.
提案手法
3.
本研究で提案するセンサの Linked Data 作成,公
開支援環境のモデルを図 1 に示す.以下,図 1 の各
構成要素の詳細を示す.
RDF ストア
3.1.
Linked Data を格納するデータベースである.
公開フェーズ
センサに関する
情報を入力
利用フェーズ
センサに関する情報 入力情報
入力インタフェース
RDFメタデータ
作成エンジン
ユーザ
センサのLinked data
センサの
公開者
Linked data
RDFストア
センサ
センサ
RDFストア
Sparqlクエリ
観測データ
更新フェーズ
RDFストア
検索要求
センサデータ利用
インタフェース
Sparqlクエリ
センサ
観測データ
レシーバ
Linked data
観測データ
送信元ドメイン情報
センサの
Linked data
センサのLinked data
RDFメタデータ
更新エンジン
図 1 センサの Linked Data 作成・公開支援環境の
モデル
3.4.2 センサデータ利用インタフェース
センサデータ利用インタフェースは,ユーザに対
し以下のもの提供する.
1. センサの検索機能の提供:センサの設置場所,観測
対象,寿命などでセンサを検索する.
2. Virtuoso SPARQL Query Editor:SPARQL クエ
リを作成しその場で検索を行う機能をもつ.
4.
図 2 作成するセンサの Linked Data の例
3.2.
公開フェーズ
3.2.1 センサの公開者
センサの情報を Linked Data として公開しよう
と考えている利用者である.
3.2.2 センサに関する情報入力インタフェース
センサに関する情報入力インタフェースでは,
ユーザから与えられたセンサに関するデータを取
得し,そのデータを RDF メタデータ作成エンジン
へ送信する.入力データは,プラットフォーム名,
センサ名(複数可),センサの種類,設置場所など
から構成されている.
3.2.3 RDF メタデータ作成エンジン
RDF メタデータ作成エンジンでは,受信したデー
タを元に SSN Ontology を用いてセンサの Linked
Data を作成し,RDF ストアに格納する.作成する
センサの Linked Data の例を図 2 に示す.
3.3.
本提案モデルの評価として,このモデルを使用す
ることでセンサデータの公開者の負担をどの程度軽
減できたかの評価を行った.
本評価では,実験を行い,その結果から評価を
行った.実験結果の分析には,タスクに対する負荷
仕事量(workload)を示すための手法である NASA
Task Load Index(NASA TLX)を利用した.被験
者として,岩手県立大学ソフトウェア情報の学生 3
人を対象として実験を実施した.
4.1. 実験
対象者に行わせた作業を以下に示す.
1. 温度センサ,湿度センサについてのセンサの Linked
Data を手動で作成させる.
2. 本提案のモデルを使用し同じく温度センサ,湿度セ
ンサについてのセンサの Linked Data を作成させる.
3. それぞれの作業に対し NASA TLX を適用する.
4.2.
実験結果と考察
本実験の結果を以下の表 1 に示す.
表 1 実験結果
作業 1 の 作業 2 の
平均値
平均値
負荷仕事量 (%)
作業時間 (分)
71.11
65
16.72
3
削減量
54.39
62
更新フェーズ
3.3.1 センサ
対象の観測を行っているセンサ及びセンサ群また
それを動かしているシステムである.これらはネッ
トワークに接続する機能を有しているものを想定
する.
3.3.2 観測データレシーバ
観測データレシーバは,センサからの観測データ
受信及び送信元ドメイン情報を取得する.取得した
データを RDF メタデータ更新エンジンへ送信する.
3.3.3 RDF メタデータ更新エンジン
RDF メタデータ更新エンジンは,受信したデー
タを基にセンサの Linked Data を作成及び更新す
る.Linked Data の更新アルゴリズムを以下に示す.
1. 送信元ドメイン情報を基に SPARQL クエリを作成
2. RDF ストアへ作成したクエリを送信
3. 観測データ及び問い合わせ結果を基にセンサの
Linked Data を作成
4. 作成した Linked Data を RDF ストアへ格納
3.4.
評価
利用フェーズ
3.4.1 ユーザ
センサのデータの利活用を目的とした研究者やア
プリケーション開発者を想定する.
本提案を使用することにより,センサの Linked
Data の作成・公開に対する負荷仕事量を 54.39%削
減することができた.また,実際の作業時間として
は約 1 時間削減することができた.
5.
おわりに
本研究では,センサの Linked Data 作成・公開
支援環境のモデルの提案を行い,そのプロトタイプ
を実装,評価を行った.このモデルを使用すること
で,センサの Linked Data 作成・公開の負担を十分
に減らすことができたと考える.
参考文献
1) Xiaoming Zhang, Yunping Zhao, Wanming Liu:
Transforming Sensor Data to RDF based on SSN
Ontology, Advanced Science and Technology Letters, Vol.81, (CST 2015), pp.95–98 (2015).
2) Catherine Roussey, Stephan Bernard, Géraldine
André, Oscar Corcho, Gil De Sousa, Daniel Boffety, and Jean-Pierre Chanet: Weather Station
Data Publication at Irstea: an Implementation Report, TC/SSN@ISWC 2014, pp.89–104 (2014).