オントロジーを用いたTV番組グラフ 作成システム 株式会社東芝 研究開発センター 溝口祐美子 [email protected] Copyright 2006, Toshiba Corporation. 発表内容 • • • • • • • • 研究の背景 番組グラフを用いた番組検索インターフェース 番組間の関連度計算アルゴリズム 番組のタグ付け ネットワークを介したタグ付けの共有 速度評価 まとめ 今後の課題 2 1 研究の背景:TV番組表からTV番組グラフへ • テレビ番組数の増加 – 多チャンネル化(地上波、BSデジタル、ケーブルTV) – インターネットによる動画配信 • リアルタイム視聴から録画視聴へ – デジタルレコーダなどの普及 • 番組表(時間x局)では一覧性に限界 • 時間軸はそれほど重要な切り口ではない 番組間の関連によるグラフ表示すること で控えめな番組推薦 東芝情報システム株式会社と共同研究 3 TV番組グラフを用いた番組検索インターフェース 4 2 録画済み番組 5 パラメータ調整インターフェース 6 3 TV番組グラフのシステム構成 インターネット 距離をノード数または線の太さで表す 番組アイコン付き 放送予定番組 ユーザタグ HDD録画済番組 番組情報 DB タグ付け機能 番組 オントロジー TouchGraph 描画機能 2番組情報 番組間距離 関連度計算機能 7 オントロジー EPG属性 番組オントロジー 放送局オントロジー 1. 放送局 2. 放送時間帯 3. 曜日 4. タイトル 映画作品オントロジー 5. ジャンル 番組ジャンルオントロジー 6. 人名 人物オントロジー 出演者,監督,脚本,声優など 7. 内容・あらすじ 16クラス,14インスタンス 時間オントロジー 18クラス,12インスタンス 2154クラス,212751インスタンス 5837クラス, 192042インスタンス 地名オントロジー 9937クラス, 239676インスタンス 8 4 オントロジー例 放送局オントロジー 時間オントロジー 映画作品オントロジー Station 時間 Public Station 祝日 NHK総合 映画 Commercial Station ウイークデー 月 番組ジャンルオントロジー コメディ 夜 マルチ タレント 刑事 ゴールデン 地名オントロジー 人物オントロジー 水野裕子ト ニュース報道 朝 ミステリー 歴史 日本の地理 タレント ドラマ全般 ドキュメンタリー教養全般 アドベンチャー ロマンス 火 ジャンル スポーツ全般 時間帯 日本テレビ TBSテレビ 日本の岬 お笑い 落語家 宗谷岬 吉本 日本の山 日本の登山基地 日本百名山 ドキュメンタリ・教養 林家三平 林家いっ平 笑福亭仁鶴 島田紳助 新穂高温泉 上高地 富士山 9 TV番組間の関連度 n R( p1, p 2) = ∑ (∂iDi ( p1, p 2)) i =1 (1) 基本は,オントロジ毎 に計算した距離の合算 (2) オントロジ毎に重み付け を変える.ヒューリスティック なルールを導入して重みを 決定. (3) オントロジ毎に距離 を計算する(1つ前のス ライド).包摂関係にあ る場合は,重み付けす る. 10 5 番組の距離 各番組のEPG情報から所定のキーワードを抽出 08/05 12:15-12:45 @ NHK総合 バラエティ生活笑百科 [出]林家いっ平 [司]笑福亭仁鶴 距離2 (落語家つながりで,距離が近いと判定) 08/06 17:15-17:20 @テレビ東京 バンセン核家族 [出]林家三平 [出]爆笑王 距離計算の種 (例:録画予約済み番組, ユーザが興味を持った番組) 距離4 08/09 22:00-22:54 @TBS 世界バリバリバリュー [司]島田紳助 [司]水野裕子 11 オントロジーと番組 movie ontology Movie & drama comedy adventure mystery Grey’s Anatomy romance crime history Sleepless in Seattle Apollo 13 performer ontology CSI Crime Scene Investigation location ontology United States Star Seattle Tom hanks Gary Sinise Sleepless in Seattle Apollo 13 CSI New York CSI New York Las Vegas NY Sleepless in Seattle Grey’s Anatomy CSI Crime Scene Investigation CSI New York 12 6 オントロジー毎の番組間の距離 作品 オントロジー “CSI Crime Scene 出演者オントロジー 地名オントロジー 1 6 3 “CSI New York” と ”Apollo 13”の距離 5 2 6 “Sleepless in Seattle” と ”Grey’s Anatomy”の距離 3 6 1 Investigation” と “ CSI New York” の距離 出演者オントロジーの観点 では最も近い 作品オントロジーの観点で は最も近い 地名オントロジーの観点で は最も近い 13 重み付けによる関連度の変化 均等 作品 1 出演者 1 地名 1 作品オントロジー 出演者オントロジ 地名オントロジー 重視 ー重視 重視 作品 2 出演者 1 地名 1 作品 1 出演者 2 地名 1 作品 1 出演者 1 地名 2 “CSI Crime Scene Investigation” と “ CSI New York” の距離 10 11 16 13 “CSI New York” と ”Apollo 13”の距離 13 18 15 19 “Sleepless in Seattle” と ”Grey’s Anatomy”の距離 10 13 16 11 重視する観点によって関連度は異なる! 重み変更機能で好みの観点をカスタマイズ! 14 7 距離計算の高速化 リアルタイムにグラフの関連を変更するためには、オントロジ ーの大きさに左右されない高速な再計算が必要。 c1 c2 パスP1 映画 c3 邦画 c4 ホラー c5 ヒューマン ドラマ c1 映画作品オントロジー c2 洋画 c6 SF c7 c3 邦画 c4 サスペンス パスP2 映画 ホラー c5 ヒューマン ドラマ 洋画 c6 SF c7 サスペンス 映画B c8 c9 XX監督 YY監督 映画A c10 ZZ主演 共通部分 深さ1 c9 XX監督 YY監督 c10 ZZ主演 残り 深さ2 ルートからc9へのパスP1: c1→c3→c6→c9 ルートからc7へのパスP2: c1→c3→c7 この部分は事前に計算しておく c8 両者を合算した値3が c9とc7の距離 (1回の集合演算で求まる) 残り 深さ1 15 タギング機能 感動 泣ける 泣ける 笑える スリリング 08/05 12:15-12:45 @ テレビ朝日 Applo13 [出]Tom Hanks, Gary Sinise 設定 笑える 出演者 08/09 22:00-22:54 @テレビ東京 Sleepless in Seattle [出]Tom Hanks 出演者 スリリング 08/06 17:15-17:20 @テレビ東京 CSI New York [出] Gary Sinise emotion tragic sorrow tears Heart-warming funny 16 8 タグの作成と共有 タグを追加 Movie & drama 番組にタグ 付け comedy adventuremystery horror romance history 4 3 crime 1 2 インターネット Movie & drama comedy adventuremystery Movie & drama romance 4 5 history 3 crime 1 comedy adventuremystery 2 romance 4 history 3 crime 1 2 17 タグ付けの共有による恩恵 • • • • • 一人ひとりの少ない労力で大量番組の分類を実現。 追加されたタグから新しい分類の切り口を発見。 賛同できる分類を取捨選択。 視聴者間のコミュニケーション。 タグどうしの関係付けを共有することで、オントロジーのメンテナ ンスを支援。 18 9 速度評価 オントロジーのクラス数と距離計算時間 time by ontology size time(msec) 5000 4000 3000 2000 time(msec) 1000 0 16 18 24 2154 5837 ontology size 番組数と距離計算時間 time by EPG size time(msec) 100000 80000 60000 40000 time(msec) 20000 0 100 200 300 400 500 EPG size 19 まとめ • 録画番組などのユーザが興味のある番組に関連する番組をグ ラフ表示することによって番組をひかえめに推薦。 • Light weightなオントロジーを組み合わせ、総合的な関連度を 計算するアルゴリズムを開発。 • ユーザが組み合わせるオントロジーや重要視するオントロジー をカスタマイズすることで自分の嗜好に合うよう関連度を調整。 • 関連度計算の高速化手法によってオントロジーの大きさに因ら ない高速な計算を実現。 • 番組にタグ付けすることによってユーザの観点で分類。 • ネットワークを介して番組へのタグ付けを共有し、ユーザ同士の 番組推薦を実現。 20 10 今後の課題 • 大量の番組数から必要な情報を絞り込む方法の検討 • 重み調整によるユーザの嗜好の反映の精度の評価 • オントロジーの作成支援 21 デモ展示中です。 奮ってお越し下さい。 22 11
© Copyright 2024 Paperzz