行動特性に基づく人間の興味の発見 - Human

HAI シンポジウム 2016
Human-Agent Interaction Symposium 2016
P-12
行動特性に基づく 人間の興味の発見
北川 遼 1 ∗
Ryo Kitagawa1
長谷川 孔明 1
Komei Hasegawa1
今井 倫太 1
Michita Imai1
慶應義塾大学
Keio University
1
1
Abstract: 人間の行動は様々 な 意図が絡んで決定づけ ら れて いる . 人間の行動から 意図を 発見し モ
デル化する こ と は人間の行動様式の理解を 深め , 行動から 意図を 推定する 事に 必要不可欠であ る . 本
稿では意図の中でも 特に「 興味」 に 着目し , 自然な 意図の発見のため実験室ではな く 実際のポス タ ー
やロ ボッ ト 等の発表の場と いう 条件の下, 発表者やそ の聴衆がいる 中で自然に 興味を 持っ た人間がと
る 行動の特徴を 考え る .
1
はじ めに
人間の行動は様々 な 意図に 基づき 決定さ れる . よ っ
て , 人間の行動を 解析する こ と でそ の人間の意図を 読
み取る こ と ができ る . ユーザと エージェ ン ト と のイ ン
タ ラ ク ショ ン において , エージェン ト がユーザの意図を
読み取る こ と は, ユーザの意図に そ っ た 情報の提示や
活動の支援を する こ と において 必要不可欠である . よ っ
て , エージェ ン ト は人間の行動から そ の意図を 読み取
る 必要があ る . 本研究では意図の中でも 実際の行動に
結びつき やすい「 興味」 に 着目し , 自発的な 人間の行
動から 興味を 読み取る こ と について 取り 組む.( 図 1) 人間の興味の推定に 関する 研究の例と し て , 林ら は
視線を 軸に ユーザの興味を 推定する シ ス テ ム [1] を 提
案し た . こ の研究はユーザの前に あ る 画面に いく つか
のス ラ イ ド を 表示し , ユーザの視線と 発話から 最も 興
味のあ る 事項を 推定し 提示し た . ま た , 中野ら は没入
型の会話環境を ユーザに 提示し , そ の環境に 存在する
エージェ ン ト と ユーザと の会話に おけ る 話題を ユーザ
の視線から 決定し た [2].
し かし , こ れら の従来手法は実験室環境で行われて
おり , ユーザに は予め実験者に よ り ど のよ う な タ ス ク
を 実行する のか指示さ れて いる . さ ら に シス テ ム が対
応でき る ユーザは1 人に限ら れており , ユーザと システ
ムが向かい合っ た状態での興味推定を 行っ て いる . その
ため, ユーザはシステムから 離れる こ と ができ ず, ユー
ザの興味の対象は, 必然的に シス テ ム 内のト ピ ッ ク に
限定さ れて し ま う . し かし な がら , ユーザの興味は自
然発生する も のであ り , 状況が固定さ れた 実験室環境
で単独に 行われる も のではユーザの自然な 興味を 測定
する のは難し い. ま た , 人間の興味は対象物だけ に 起
∗ 連絡先: 慶應義塾大学理工学部情報工学科
〒 223–0061 神奈川県横浜市港北区日吉 3–14–1
E-mail: [email protected]
図 1: 対象物に 興味を 持つ人の様子
因する も のではな く , 対象を 注視し て いる 他の人間や,
そ の対象を 広告する 発表者な ど に も 起因し う る こ と が
考え ら れる .
そ こ で, 本研究ではユーザが移動し な がら 自由に 興
味の対象を 選択でき る 実環境に おいて , 興味を 持っ た
人間の行動モデルを 分析し , 分析し た 行動モデルに 基
づき 興味を 持っ て いる 人間の推定, 提示を 行う シス テ
ム を 提案する . はじ めに , 発表の場で興味を 持っ た 人
間がど のよ う な 行動を 取る かを 調べる た め, 実際の見
本市や発表会, 学会で予備実験を 行っ た . 予備実験の
結果, 興味を 持っ た人間は対象物を 注視する と と も に ,
移動速度が低下する こ と がわかっ た . よ っ て , 本研究
は人間の視線方向と 移動速度の2 つの特徴から 行動モ
デルを 構築し . あ る 特定の対象物に 興味を 持っ た と 思
われる 人間の検出を 行う . こ のシス テ ム を 用いる こ と
で, 例え ばど のよ う なポスタ ー, ト ピッ ク に対し て 人々
は興味を 向け る のか, ロ ボッ ト やハード ウ ェ ア であ れ
ばど のよ う に 人々 へア プロ ーチを すれば興味を 集める
こ と ができ る のかを 調べる こ と ができ る と 考え ら れる .
2
従来研究
シス テム がユーザに 対し て 様々 な ト ピッ ク を 提示し ,
ユーザが興味を 示し たも のを 推定する 問題について, 多
く の研究が取り 組んでいる . 林ら が提案し た , 視線を
軸にユーザの興味を 推定する システム [1] では, システ
ム がポス タ ー発表を 行い, プレ ゼン テ ーショ ン 時の補
足説明や, ト ピ ッ ク の解説な ど の必要性を ユーザの視
線と 発話から 判断し た . ま た , 中野ら は没入型の会話
環境を ユーザに 提示し , そ の環境に 存在する エージェ
ン ト と ユーザと の会話に おけ る 話題を ユーザの視線か
ら 決定し た [2]. ま た, 倉野ら はモバイ ルデバイ ス を 視
聴し て いる ユーザの反応を セ ン サで検知し , そ れを 興
味推定に 用いる シス テム [3] を 提案し た.
こ れら の研究では, シス テ ム がユーザと 大き く 面し
て いる た め, ユーザがハード ウ ェ ア に 興味を 向け る こ
と が興味推定の前提と な っ て いる . し かし , ユーザは
シス テ ム の前から 移動せず, シス テ ム 自身がユーザの
興味を 促し て いる た め, ユーザの自発的な 興味を 推定
し て いる と は言え な い. 実際に ユーザの自然な 意図を
推定する た めに は, ユーザが自発的に 興味を も ち , 行
動し た 様子から 推定する 必要があ る . よ っ て 本研究で
は, ユーザが自由に 興味の対象を 選択でき る 実環境で
の興味の推定を 試みる .
3
3.1
同時に , 対象物を 理解する た めに 長く 観察し よ う と す
る ので, ゆっ く り と 歩き な がら 対象物へと 近づく 様子
が観察さ れた . よ っ て , 通行人の視線方向と そ の移動
速度に 着目する こ と で興味を 持っ て いる 人間を 発見で
き る と 考え ら れる . 本研究は人間の視線方向と 移動速
度に 基づき 興味の推定を 行う .
興味の推定
想定さ れる 環境
本研究では, ある 特定の対象物に対し て , 興味を 持っ
た 人間を 推定する シス テ ム を 提案する . 実環境と し て
図 2 のよ う な 展示ブース を 想定し , 対象物の他に も 別
のポス タ ーやロ ボッ ト な ど の展示物, ま た そ れら に 興
味を 持ち 集ま っ た 他の人々 な ど , 様々 な 興味を 引く 対
象が存在し , 人間は自由に 移動でき る 場面に ついて 考
え る . こ のよ う な 状況で, ユーザは興味の対象を 自由
に 選択でき , 自然に 発生し た 興味に 基づいた 行動を 行
う こ と ができ る と 考え ら れる .
3.2
図 2: 想定さ れる 環境の例
興味を 持っ た人の特徴
興味を 持っ た 人間がど のよ う な 行動を 取る のか調べ
る た め, 予備実験と し て 発表会に 赴き , 展示内容に 興
味を 持っ た 人の様子を ビデオカ メ ラ で撮影し た . 予備
実験の結果, 対象物へ興味を も っ て いる 人間は図 3 の
よ う に対象物を 注視し な がら 移動する 様子が見ら れた.
図 3: 興味を 持っ て いる 人間の例
4
実装
本研究は人間のよ り 自然な行動を 観察し たいため, そ
れ自体が興味を 引く よ う な 巨大な 測定シス テ ム の使用
は望ま し く な い. 人間から 見え る シス テ ム の大き さ を
最小限に する た め, 本研究で使用する ハード ウ ェ ア は
小型の Web カ メ ラ のみと する . Web カ メ ラ から 取得
さ れた 映像から 顔と そ の人間の検出を 行い, そ こ から
視線方向と 移動速度を 推定, 対象物を 注視し て いる と
思われる 人物を 表示する . こ こ で表示さ れた 人物がど
のよ う な 行動を 取る のか, そ の視線方向と 移動速度に
基づいて 解析し , 実際に 興味を 持っ て いる と 思われる
人間を 提示する .
4.1
視線方向の検出
人間の顔と そ の視線方向を 検出する 手法と し て , 二
次元の映像情報から 複数人の顔と そ の視線方向を 検出
でき る OpenFace[4] を 用いた . こ こ で検出し た 顔と そ
の視線方向から , 対象物への注視時間を 測定する . 顔
検出と 視線方向推定の様子を 図 4 に 示す. 図 4 の左は
Web カ メ ラ で取得し た画像であり , 検出し た顔上に 赤
い点で顔のモデルを 重畳し て 表示し て いる . 図の右上
の白い顔のモデルは, 検出し た 顔の位置と 方向を 仮想
的に 表示し て おり , そ の顔から 推定し た 視線方向を 青
い棒線と し て 表し て いる . ま た , 図の右下の物体は展
示物な ど の対象物の位置である .
5
まとめ
本研究では, 人間の行動特性から 意図を 発見する た
めに , 行動に 結びつき やすい興味に 着目し , 人間の行
動から 興味の対象を 推定する 手法について 取り 組んだ.
人間が自由に 移動し な がら , 興味の対象を 選択でき る
実環境下に おいて , 興味を 持っ た 人間がど のよ う な 行
動を 取る か調べる た め予備実験を 行っ た . 予備実験の
結果, 興味を 持っ た 人間はそ の視線方向と 移動速度に
特徴が見ら れる こ と がわかっ た . よ っ て , 本研究は人
間の視線方向と 移動速度に 着目し , こ の2 つの特徴に
基づく 人間の行動モデルから 興味を 持っ た 人間を 推定
する シス テ ム を 提案し た . 今後の展望と し て は, 興味
を 持っ て いる 人間はど のよ う な 特徴を 持つ行動を 取る
のかを 更に 掘り 下げて いき たいと 考え て いる .
参考文献
[1] 林 宗一郎, 吉本 廣雅, 平山 高嗣, 河原 達
也: マ ルチモーダルな 認識に 基づく ポス タ ー発表
シス テム , IPSJ Interaction, pp. 505–508 (2012)
[2] 中野 有紀子, 岡 兼司, 佐藤 洋一, 西田 豊
明: ユーザーの視線に気づく 会話エージェント , The
19th Annual Conference of the Japanese Society
for Artificial Intelligence, pp. 505–508 (2012)
図 4: 顔検出と 視線方向推定の様子
4.2
移動速度の検出
人の検出を 行う ための手法と し て Faster-RCNN[5] を
用いた . こ の手法と 4.1 節で示し た 手法と を 組み合わ
せる こ と で, 視線方向から 対象物を 注視し て いる と 思
われる 人物を 矩形表示する . こ の矩形の移動速度から
ユーザの移動速度を 測定する こ と ができ る .
4.3
興味を 持っ て いる 人の推定
得ら れた 注視時間と 移動速度を パラ メ ータ と し , 機
械学習を 行う こ と で行動モデルを 構築する . こ の行動
モデルに 基づき 検出器を 作成する こ と で, 興味を 持つ
人物の推定を 行う こ と ができ る .
[3] 倉野 大二郎, 松村 耕平, 角 康之: マ ルチ モ ー
ダルデータ を 用いた 映像閲覧者の興味推定, IPSJ
Interaction, pp. 435–439 (2013)
[4] Baltru, T., Robinson, P., and Morency, L. P. :
OpenFace: an open source facial behavior analysis toolkit, IEEE Winter Conference on Applications of Computer Vision, pp. 1–10 (2016)
[5] Ren, S., He, K., Girshick, R., and Sun, J.: Faster
R-CNN: Towards real-time object detection with
region proposal networks, dvances in neural information processing systems, pp. 91–99 (2015)