講演資料 - セマンティックウェブとオントロジー研究会

構造化データを活用した
インバウンドアプリケーションへのコンテンツ展開
2016.11.10
NHK放送技術研究所 浦川真
NHKワールドが保有するコンテンツは、
インバウンドアプリケーションに有用か
food
Radio
Live TV
VOD
Culture
Web
Article
news
2
ISWCに合わせて開催されるアイディアソン/ハッカソンに、
NHKワールドのコンテンツを提供することで、
実際の利用により近い状況での検証をおこなう。
※LOD形式でのデータ公開は期間限定での検証
3
6~7月:合意形成
↓
1.5か月:データ構造化作業
8月:アイディアソン
↓
0.5か月:プロトタイプ開発
9月:ハッカソン
↓
1.0か月:学会用アプリ開発
10月:国際学会
4
インバウンドアプリケーションに
有用なコンテンツとは?
[仮説]
サービス面から見ると・・・日本を知ることができるコンテンツ
開発面から見ると・・・構造化しやすいコンテンツ
 ライブ配信番組表(2日分)
 VODデータ+シーンメタ(約100本)
 レシピ(約400本)
5
システム概要(データフロー)
技研
EPG
WEB-API
国際局
サーバ
(API用)
csv
オフライン
オンライン
VOD
レシピ
構造化
AWS
追加・更新・削除
データストア
(Stardog)
データ変換
サーバ
画像処理
追加
WEB-API
構造化
構造化
@ISWCサイト
観光情報
位置情報
6
システム概要(データフロー)
技研
EPG
WEB-API
国際局
サーバ
(API用)
csv
オフライン
オンライン
VOD
レシピ
構造化
AWS
追加・更新・削除
データストア
(Stardog)
データ変換
サーバ
画像処理
追加
WEB-API
構造化
構造化
@ISWCサイト
観光情報
位置情報
7
構造化のポイント
EPG
構造化したEPG:
・http://www3.nhk.or.jp/nhkworld/en/tv/schedule/
※2日分の放送予定を毎日定時に取得してRDF化する必要があるため、
基本的な情報での構造化のみ
20161001T12:00:00
nw:onair
20161001T12:30:00
nw:onairEnd
2054
E001
nw:title
Trails to Tsukiji
nw:seriesId
nw:airingId
003
nw:description
This program showcases Japanese food
ingredients. Today‘s focus is the black
paper-like seaweed・・・
8
システム概要(データフロー)
技研
EPG
WEB-API
国際局
サーバ
(API用)
csv
オフライン
オンライン
VOD
レシピ
構造化
AWS
追加・更新・削除
データストア
(Stardog)
データ変換
サーバ
画像処理
追加
WEB-API
構造化
構造化
@ISWCサイト
観光情報
位置情報
9
構造化のポイント
VOD
構造化したVOD:
・Journesy in Japan(http://www3.nhk.or.jp/nhkworld/en/tv/journeys/)
・Tokyo EYE2020(http://www3.nhk.or.jp/nhkworld/en/tv/tokyoeye2020/)
※随時更新不要のため、Dbpediaとのエンティティリンキングを実施
※30分尺が基本であるため、ピンポイント視聴を可能とするシーンメタを付与
http://www3.nhk.or.jp/nhkworld/en/vod/up
date/episodes/20160628
nw:link
yyyymmddhhmm
nw:id
nw:publishDate
nw:hasloaction
V001
L122
nw:hasScene
rdfs:seeAlso
S342
文字エリア抽出(画像処理)
↓
人手でDbpediaとのリンク
dghaherhn66pkg
nw:tc
150s
Dbpedia/resouse/nagasaki
rdfs:seeAlso
nw:title
Journeys in Japan
http://dbpedia.org/resource/Castella
nw:subtitle
A Taste of Nagasaki
10
シーンメタの生成
VOD
画像処理ツール(※NHK技研開発)を使い文字領域の抽出を行い、
手動でアノテーション・データ構造化
画像処理モジュールと
その処理結果
文字有無判定
モジュール
Dbpediaリソースの登録
文字入力
RDFストアへ登録
11
シーンメタの生成
VOD
s
付与したシーンメタの一例
http://nwlod.nhk.or.jp/V200
7261
http://nwlod.nhk.or.jp/V200
7261
http://nwlod.nhk.or.jp/V200
7223
http://nwlod.nhk.or.jp/V200
7223
http://nwlod.nhk.or.jp/V200
7235
http://nwlod.nhk.or.jp/V200
7232
http://nwlod.nhk.or.jp/V200
7258
scene_k
http://nwlod.nhk.or.jp/V200
7261_s356
http://nwlod.nhk.or.jp/V200
7261_s355
http://nwlod.nhk.or.jp/V200
7223_s167
http://nwlod.nhk.or.jp/V200
7223_s168
http://nwlod.nhk.or.jp/V200
7235_s128
http://nwlod.nhk.or.jp/V200
7232_s101
http://nwlod.nhk.or.jp/V200
7258_s327
word
tc
dbpedia
Minami Ise Town
279
http://dbpedia.org/resource/Minami
ise,_Mie
Kashiko-jima
Island
112
http://dbpedia.org/resource/Kashik
o_Island
Himeji Station
161
http://dbpedia.org/resource/Himeji
_Station
Himeji Castle
183
http://dbpedia.org/resource/Himeji
_Castle
Kokuto shochu
1002
http://ja.dbpedia.org/resource/奄美
黒糖焼酎
Unidon
1651
http://ja.dbpedia.org/resource/ウニ
丼
Jigen-ji
1009 -
12
システム概要(データフロー)
技研
EPG
WEB-API
国際局
サーバ
(API用)
csv
オフライン
オンライン
VOD
レシピ
構造化
AWS
追加・更新・削除
データストア
(Stardog)
データ変換
サーバ
画像処理
追加
WEB-API
構造化
構造化
@ISWCサイト
観光情報
位置情報
13
構造化のポイント
レシピ
構造化したレシピ:
・http://www3.nhk.or.jp/nhkworld/en/food/#recipes
※日本語と英語が一元管理されたエクセルとしてデータが存在したため、
日本語と英語でセットで参照できるよう構造化
Broiled Sardines in Kabayaki Sauce@en
nw-recipe:title
いわしのかば焼き@ja
nw-recipe:title
R001
hasIngredientRelation
nw-recipe:quantity
RI01
1尾
nw-recipe:hasIngredient
I94
hasDirection
nw-recipe:name
いわし@ja
sardines @en
RS01
nw-recipe:order
nw-recipe:title
3
nw-recipe:title
火を止め、混ぜておいた【たれ】を回し
かける。弱火にかけ、スプーンでたれを
すくってかけ、全体になじませる。@ja
Turn off the heat and drizzle the sauce over the fillets.
Place over low heat and repeatedly spoon the sauce
over the fillets until they are fully coated. @en
14
データ仕様
【語彙】語彙
PREFIX
名前空間
RDF
rdf
http://www.w3.org/1999/02/22-rdf-syntax-ns#
RDF Schema
rdfs
http://www.w3.org/2000/01/rdf-schema#
XML Schema
xsd
http://www.w3.org/2001/XMLSchema#
OWL
owl
http://www.w3.org/2002/07/owl#
NHK world EPG/VOD
nw
http://nw-lod.nhk.or.jp/
NHK world Recipe
nw-recipe
http://nw-lod.nhk.or.jp/recipe#
※NHKワールドの名前空間は本検証期間のみのために設けています。
【クラス】Class
説明
nw:EPG
ライブ配信番組表を表すクラス
nw:VOD
VOD動画を表すクラス
nw:Scene
動画のシーンを表すクラス
nw:Keyword
キーワードを表すクラス
nw:Location
VOD動画が対象とする地名を表すクラス
nw-recipe:Recipe
レシピを表すクラス
nw-recipe:IngredientRelation
レシピと食材の仲介するためのクラス
nw-recipe:Ingredient
食材を表すクラス
nw-recipe:Direction
料理の手順を表すクラス
nw-recipe:Preparation
料理の下ごしらえを表すクラス
15
データ仕様
【属性】
※EPG・VOD
Property
種別
Domain
Range
説明
nw:hasScene
Object Property
nw:VOD
nw:Scene
各VODに紐づけられたシーン
nw:hasKeyword
Object Property
nw:VOD
nw:Keyword
各VODた対象とするキーワード
nw:hasLocation
Object Property
nw:VOD
nw:Location
各VODた対象とする地名
nw:title
Data Property
xsd:string
タイトル
xsd:string
サブタイトル
xsd:string
概要
xsd:string
番組内容文
xsd:anyURI
WEBサイト
xsd:anyURI
サムネイル
nw:EPG
nw:VOD
nw:Scene
nw:subtitle
Data Property
nw:description
Data Property
nw:content
Data Property
nw:link
Data Property
nw:thumbnail
Data Property
nw:EPG
nw:VOD
nw:EPG
nw:VOD
nw:EPG
nw:EPG
nw:VOD
nw:EPG
nw:VOD
nw:Scene
nw:onair
Data Property
nw:EPG
xsd:dateTime
番組開始日時
nw:onairEnd
Data Property
nw:EPG
xsd:dateTime
番組終了日時
nw:publishDate
Data Property
nw:VOD
xsd:dateTime
動画公開日時
nw:expireDate
Data Property
nw:VOD
xsd:dateTime
動画公開終了日時
nw:duration
Data Property
nw:VOD
xsd:int
動画の長さ(秒)
nw:id
Data Property
nw:VOD
xsd:string
動画再生用ID
nw:tc
Data Property
nw:Scene xsd:int
rdfs:seeAlso
Data Property
nw:genre
Data Property
nw:VOD
nw:Scene
nw:EPG
動画におけるシーンのIN点(秒)
※動画冒頭からの秒数
xsd:anyURI
VODやシーンからDbpediaリソースへのリンク
xsd:string
番組ジャンル
16
データ仕様
【属性】
※レシピ:抜粋
Property
種別
Domain
Range
nw-recipe:hasDirections
Object Property
nw-recipe:Recipe
nw-recipe:Directions 各レシピに紐づく手順
説明
nw-recipe:hasIngredientRelation
Object Property
nw-recipe:Recipe
nw-recipe:IngredientRe各レシピに紐づく食材への仲介
nw-recipe:hasIngredients
Object Property
nw-recipe:IngredientRelation
nw-recipe:Ingredient 各レシピに紐づく食材
nw-recipe:hasPreparations
Object Property
nw-recipe:Recipe
nw-recipe:Preparation各レシピに紐づく下ごしらえ
nw-recipe:title
Data Property
nw-recipe:Recipe
xsd:string
レシピ名(日本語/英語)
xsd:string
手順名(日本語/英語)
xsd:int
調理時間(分)
nw-recipe:Direction
nw-recipe:Preparation
nw-recipe:duration
Data Property
nw-recipe:Recipe
難易度(日本語/英語)
nw-recipe:difficulty
Data Property
nw-recipe:Recipe
xsd:string
例)
nw-recipe:EnglishURL
Data Property
nw-recipe:Recipe
xsd:anyURI
レシピ掲載WEBサイト(英語版)
nw-recipe:JapaneseURL
Data Property
nw-recipe:Recipe
xsd:anyURI
レシピ掲載WEBサイト(日本語版)
nw-recipe:thumbnail
Data Property
nw-recipe:Recipe
xsd:anyURI
レシピ画像
nw-recipe:nutrition_value
Data Property
nw-recipe:Recipe
xsd:int
摂取カロリー(kcal)
nw-recipe:yield_value
Data Property
nw-recipe:Recipe
xsd:int
作れる料理の対象数
nw-recipe:yield_unit
Data Property
nw-recipe:Recipe
xsd:string
作れる料理の対象(単位)
nw-recipe:quantity
Data Property
nw-recipe:Ingredient
nw-recipe:name
Data Property
nw-recipe:Ingredient
「簡単/普通/難しい」/「easy/average/difficult」
nw-recipe:order
Data Property
nw-recipe:Direction
nw-recipe:Preparation
必要な食材の数量
xsd:string
食材名(日本語/英語)
xsd:int
調理手順番号
17
神戸関連データ
観光地/レストラン/カラオケ
※最終的なデータは,若干のデータ構造(プロパティ)の修正がされています
Observation deck on the 24th Floor of Kobe City Hall (the Building #1)"@en
rdfs:label
8
geo:lat
34.689467
rdfs:label
神戸市役所1号館24階@ja
schema:adress
ishk:dbpediaLink
geo:long
神戸市中央区加納町6"@ja
6-5-1 Kano-cho, Chuo-ku, Kobe"@en
http://ja.dbpedia.org/resource/神戸市役所
135.195755
rdfs:comment
rdfs:comment
都心市街地からウォーターフロントにかけての景色を180度
以上の大パノラマで楽しむことができる。・・・@ja
The Observation Deck at the Kobe City Hall offers
beautiful panoramic views ・・・@en
18
ISWC2016@KOBE連携ハッカソン
セマンティックとウェブオントロジー研究会(人工知能学会)に協力して開催
 日時
 8月20日:アイディアソン@神戸 → 9月
 参加者
3日:ハッカソン@神戸
 国内外のエンジニア(大学・企業など) 約20~25名
 開発されたアプリケーション
 Japanese menu guide:
ISWC2016アプリに採用!!
日本語メニューを撮影して食べ物名から各種情報を提示
 After Fiver
学会終わりの外国人に神戸で寄り道してもらうアプリ
 Kobe Lifeline:
災害・緊急時に必要な情報を、旅行者にわかりやすく提示
 Food Challenge:
日本の料理(チャレンジメニュー)や、故郷の料理に近い料理(安全なメニュー)を提示
19
ISWC2016に向けた開発
10月17~21日に、神戸で開催されるISWC参加者に利用してもらい、
アンケートやログからデータ構造化の有用性について検証する。
【AfterFiver】
今いる場所+目的地+使える時間から、
観光地(LOD)を地図上に表示
【Japanese Cature】
分からない日本語を撮影し
DbpediaやNHKレシピ(LOD)などを表示
20
AfterFiverについて
学会終わりに何しよう?
→学会会場にいて、新神戸駅のホテルに1時間で戻りたい。
今いる場所
行きたい場所
使える時間
②候補地のエリアを限定した上で、
各候補地へのルート検索し所長時間を取得
(Google Direction API)
地図表示
2
1
3
①神戸LODから
結果表示
データ取得
(SPARQL)
③各候補地の平均滞在時間+移動所要時間が、
ユーザー指定の所要時間以内の候補地のみ結果表示
神戸
LOD
例)
5分
1
60分
40分
=105分
詳細表示
④候補地名から画像検索
(Google Custom Search API)
⑤NHK LODからコンテンツ取得
(SPARQL)
21
JapaneeCaptureについて
この文字はどういう意味?
→日本語しかないメニューから、情報を取得したい。
①画像から文字領域・内容取得
(Google Cloud Vision API)
詳細表示
②選択された文字列から情報取得
(Google Translate API)
(Google Custom Search API)
(Dbpedia: SPARQL)
(NHK LOD: SPARQL)
22
 データ集計
 徐々に「JapaneseCapture」利用の占める割合が高くなっている。
全日程
ユニーク
ユーザー
数
全機能
操作回数
10/17
10/18
10/19
10/20
10/21
222
90
89
37
47
38
AfterFiver
3378
1608
998
399
373
32
JapaneseCapture
1764
276
639
533
316
11
319
127
60
41
91
10
WatchTV
 アンケート調査結果
 サービス設計とGUIは良いが、神戸以外のデータも追加してほしい。
 レストランというジャンルから、さらにフィルター(「神戸牛」のみ等)
して表示してほしい。
 スポットに関連する動画は不要という意見もあり。
23
NHKワールドが保有するコンテンツは、
インバウンドアプリケーションに有用か
food
Radio
Live TV
VOD
Culture
Web
Article
news
24
LOD形式にしたことで、
既存のhtmlベースとは違うコンテンツ展開ができた。
・外部サービスからの利用頻度の向上
・ユーザーへの露出頻度の向上
・サービス開発期間の短縮
実際に訪日外国人向けのアプリケーションで検証できた
ため、コンテンツへのニーズを把握することができた。
・動画をそのまま視聴するニーズは少ない
・レシピといった生活に近いコンテンツはニーズがある
25
外部サービスが持っているコンテンツと、
合致するコンテンツを制作している訳ではないため、
媒介するためのデータ設計が必要。
神社についても説明しているため、
他の神社での説明にも使える。
神社
生田神社
厳島神社
生田神社
「厳島神社の紅葉」
紅葉
●●寺
日本の紅葉の一例として利用可能
26
動画を利用しやすいカタチへの変換・内容記述を行い、
メタデータを付与してLOD化する方法を検討していく
27