インターネット上の大量の事例に基づく プレゼンテーションの解析・分類と自己学習応用 山﨑 俊彦 東京大学大学院情報理工学系研究科 電子情報学専攻 1 背景 Web上でプレゼンや講義を発信 投稿者「自分のプレゼンは良い?悪い?」 「視聴者はどんな印象を受ける?」 SlideShare[1] Udacity[2] Youtube[3] [1] Sogeti Group Presentation Movie 2011 High Resolution. https://www.ted.com/talks/2113 [2] Intro to jQuery. https://www.udacity.com/course/ud245 [3] How to Do a Presentation – 5 Steps to Killer Opener. https://www.youtube.com/watch?v=dEDcc0aCjaA 2 プレゼンテーションは究極のマルチメディア 話し方 スライド資料 身振り手振り [4] 環境 内容 構文 しかし、これまで網羅的な研究は殆どなされていない [4] Michael Green: What the Social Progress Index can reveal about your country. http://www.ted.com/talks/2134 3 アプローチと研究目標 文字の多さ 文の長さ 単語の難しさ (1) 構文の解析 講演者へのフィードバック 宇宙 科学 環境 政治 (2) 内容の解析 プレゼンテーションの入力 参考になるプレゼンの推薦 声量 トーン 話す速さ (3) 音声の解析 4 予備実験結果:TEDの1,646本のプレゼンを例に 平均で70~85%の 精度で推定可能 (a) 上位・下位10%の動画を使用 (b) 上位・下位50%の動画 (全動画) を使用 5 informativeとnot informativeな動画群 痛覚の仕組み 原発の必要性 彫刻家による作品の紹介 大事故後のリハビリの記録 6 obnoxiousとnot obnoxiousな動画群 • obnoxious 話の中身が無い 人間は水生の猿から進化した 単語や構文では判別不可能 • not obnoxious →全動画の半数以上がobnoxiousは1%未満 7 まとめ • チャレンジ • • プレゼンの解析・分類という、新しい課題 文書、音声、映像を用いて 文章構成・内容・話し方などから総合的・多角的に評価 • 今後の予定 • • • (1)構文解析、(2)内容解析、 (3)話し方解析 国内外の人工知能・文書解析の研究者とコラボレーション 教育コンテンツへの拡張 • 人工知能研究振興財団への貢献 • • ④「マルチメディアシステム高度化」 ②「デザイン向上のための知的環境構築支援システム」 8
© Copyright 2024 Paperzz