プロジェクト型研究事業報告書 2010年度版 奈良先端科学技術大学院大学 情報科学研究科 Creative and International Competitiveness Project 2010 March 31, 2011 巻頭言 教務部会 CICP2010 推進委員会 情報科学研究科では、情報処理学・情報システム学・情報生命科学の 3 専攻で取り組む教育プログラ ム「創造力と国際競争力を育む情報科学教育コア」が、平成19~21年度の文部科学省「大学院教育改 革支援プログラム」において、理工農系分野の優れた教育プログラムの一つとして採択されました。本支 援プログラムは、平成17~18年度の競争的資金による教育支援プログラム『魅力ある大学院教育』イニ シアティブの後継プログラムで、優れた組織的・体系的な教育取組に対して重点的な支援を行うことによ り、大学院教育の実質化を推進することを目的としていました。 本プログラムの柱であるアドバンストプロジェクトにおいて学生の自主性・主体性に重点を置く『学生の 自主性に基づくプロジェクト型教育』の中核事業の 1 つとして位置づけているのが提案公募型プロジェクト CICP(Creative and International Competitiveness Project)です。CICP プロジェクトは、自主性・主体性の 涵養とともに、研究計画立案・遂行能力の開発とグループ研究を通したコミュニケーション能力の向上を 目指しています。 平成22年度については、大学院教育改革支援プログラム終了後も CICP を継続実施すべきとの要望 が強かったため、規模を縮小して独自予算で実施しました。目的は、これまでと同様、情報科学の基礎研 究を推進する能力をもつ研究者と最先端技術開発のための応用力をもつ技術者を養成するという本研 究科の教育方針のもと、国際競争力をもった人材を組織的に養成する情報科学分野での卓越した大学 院教育の拠点となることにあります。 本冊子は、平成22年度における学生諸君のプロジェクト活動の概要をまとめたものです。このプロジェ クト活動を通した学生諸君の大いなる飛躍を期待して、巻頭の言葉といたします。 i 平成22年度プロジェクト型研究事業概要 1.プロジェクト型研究の位置づけ 本研究科の教育プログラムです。研究成果を出すこと自体ではなく、学生の研究プロジェクト企画・推 進力やコミュニケーション力を育むことを第1の目的としています。日々の研究とは別に、学生が自ら挑戦 したいテーマを募集し、その中から、独創性や将来性のある提案を6件程度選抜し、1件あたり100万円 を上限として経費を支給しています。大胆なテーマに挑戦し、様々な失敗を将来の糧とできる、またとな いチャンスとして、大いに活用されることを期待しています。 2.年間スケジュール概略 22年度の実施期間は8月~3月の8ヶ月でした。 6/18 WEB掲示および学内メーリングリストによりプロジェクト公募を開始 7/1 応募説明会を開催 7/20 電子メイルによる応募の締め切り 7/28 選抜会議 7/28 選抜結果公表と同時にプロジェクト開始 7/30 交付決定金額および予算執行説明会 8/6 交付申請書提出締め切り 9/16 英語プレゼンテーション特別講義 10/6 学内中間発表会1日目(英語で開催) 10/13 学内中間発表会2日目(英語で開催) 3/11 スプリングセミナーにてポスターセッションおよび来場者による人気投票 3/12 サイエンスフェスティバルにてポスターセッションおよび来場者による人気投票 最優秀賞・優秀賞表彰式 3/14 各プロジェクト報告書提出締め切り 3.応募状況 公募に対し、応募締め切り時点で20件の応募がありました。大部分の応募が締め切り5分前以降に集 中しており、提出直前まで計画を練り上げていたと推測しています。 4.選抜方法 6名の審査委員が以下の項目に基づいて各々独立に20件を書類審査しました。 A. 計画性に関する項目 A1: 公募条件を満たしているか、様式の大幅な逸脱がないか(1~5) A2: 予算目標と執行時期は適切か(1~5) B. 独創性に関する項目 B1: チャレンジングな目標か(1~5) B2: メンバの選定に特色があるか(1~5) ii C. 実現性に関する項目 C1: 裏付ける実績があるか(1~5) C2: 期間内に達成可能な計画か(1~5) D. おもしろさに関する項目 D1: スプリングセミナー等デモに馴染むか(1~5) D2: おもしろさや楽しさがあるか(1~5) ただし、最終的には、採択優先順位が明確になるよう、各審査委員に配られた10点票(1枚)、6点票 (2枚)、3点票(2枚)、1点票(1枚)を各プロジェクトに投票する形式としました。選抜会議では、合計獲得 点数が上位であることはもちろん、特定分野に偏らないよう考慮して、最終的に7件を採択しました。なお、 本報告書に収録している各プロジェクトの報告書は応募先着順となっています。 選抜時には一切考慮しませんでしたが、採択プロジェクトリーダーの内訳は、博士後期課程が2名、博 士前期課程が5名(1年:4名、2年:1名)となっており、結果的に、多数の新入生がリーダーに選抜されま した。また、メンバも加えた参加人数は、のべ36名(プロジェクト間の重複メンバも含む)に達し、多くの学 生がプロジェクト型研究に参加することとなりました。 経費に関しては、最上位プロジェクトには申請額の満額、以降、(順位-1)/10 を基準減額率として、最 大で50%減までの傾斜配分を行いました。交付金額の平均は¥57万となっています。 5.実施状況 選抜結果と同時に交付決定金額を通知し、プロジェクトリーダーに対して、改めて交付申請書の提出 を求めました。これは、減額に対する対応や、制度上支出不可能な予算執行計画の見直しを求めるだけ でなく、他プロジェクトの採否結果を元に、プロジェクトリーダーがメンバを再構成して、ベストメンバで望め るようにするための措置です。また、減額されたことを理由にプロジェクトを辞退できることを伝えましたが、 辞退者はありませんでした。 各プロジェクトの詳細な活動計画、実施内容、および、自己評価については、目次に続く本編をご覧く ださい。なお報告書は提出〆切に間に合った6プロジェクト分のみを掲載しています。 6.一般公開による評価 3月11日および12日には、最終報告会として、スプリングセミナー(他大学の学部生)およびサイエンス フェスティバル(一般の方)の参加者を対象とした、ポスターセッションを開催しました。各プロジェクトとも 趣向を凝らした成果発表を行い、参加者による人気投票の結果をもとに、最優秀プロジェクトと優秀プロ ジェクトを各1件選定しました。最優秀賞は MEJIA Ramon 君、優秀賞は水井俊文君に各々授与しました。 投票結果は末尾に掲載しています。 7.学生による自己評価 プロジェクトの計画・管理や研究費の申請・執行などの経験、中間報告会における英語での発表や議 論が大いに有益であった旨の自己評価が数多く見られました。また、目標を期限内に達成するためのス ケジュール管理などプロジェクト推進の難しさを実感した評価も多く見られました。 スプリングセミナーやオープンキャンパスにおける発表では、学外の学生にいかに興味を持ってもらう iii かに苦慮し、デモンストレーションの重要性に気付いたとの分析や、単なるシステム開発だけではなく多く の人や部署と連携してプロジェクトを遂行したことが非常に有益であったとの分析から、多くのリーダーが 大学院における通常の研究活動では得られない貴重な経験を積むことができたのでないかと考えていま す。 8.本事業の自己評価 平成22年度のプロジェクト型研究は、規模を縮小して実施しました。また、事前準備を充実させるため に、英語プレゼンテーション特別講義を開催しました。プロジェクト予算は削減されましたが、昨年同様、 学生は、単に研究室内で英語発表の練習をするだけでは得られない貴重な経験を積むことができたの ではないかと考えています。 iv 目次 巻頭言 平成22年度プロジェクト型研究事業概要 大杉直也:人の目 VS 生体信号解析、どちらが人の心を読めるのか …………………………………………………………………………………… 1 Erlyn Manguilimotan:Emotion and Stress Detection Using Social Networking and Mobile Applications …………………………………………………………………………………… 8 井元兼太郎:健康情報を用いたライフシミュレーション ……………………………………………………………………………………17 幾世知範:クラウドを暴く可視化システムの開発 ……………………………………………………………………………………27 水井俊文:ぶれない一途なレーザーポインタの開発 ……………………………………………………………………………………37 MEJIA Ramon Francisco:Project Bayanihan: A Web 2.0 Front-end for Flood Mapping Systems ……………………………………………………………………………………47 鳥倉広大:新聞を読みマーケットの動向を予測する AI 自然言語処理的マーケットシミュレータ ……………………………………………………………………………………57 付録.ポスターセッション投票結果 v 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」研究提案要旨 1.プロジェクト名 人の目 VS 生体信号解析,どちらが人の心を読めるのか 2.プロジェクトリーダー 所属講座 論理生命学講座 学年 M2 氏名 e-mail アドレス 大杉直也 [email protected] 氏名 e-mail アドレス 学生番号 0951022 3.分担者 所属講座 学年 学生番号 論理生命学講座 M2 0951048 小阪卓史 [email protected] 論理生命学講座 M1 1051084 野口卓磨 [email protected] 論理生命学講座 M1 1051092 藤居宏平 [email protected] 4.チューター 所属講座 論理生命学講座 職名 助教 氏名 渡辺一帆 5.必要経費 金額(千円) 設備備品費 支出予定月 500 8 月 品名・型名・数量/行先・目的・日数等 各種生体信号計測用機器(可能な限りレンタ ルで済ます) 50 8 月 実験記録用のビデオカメラ 150 8 月 消耗品費 PC/解析・データ管理用 50 8 月 書籍/信号処理や機械学習やパターン認識 や生体信号に関わる生物や心理学の専門書 旅費(調査目的も可) 200 1 月 合計 950 BIOSIGNALS/イタリア・研究調査・3 泊 4 日 1 6.プロジェクトの背景と目的 [背景]他人の心を知りたいという欲求は古来より存在し続けてきた。その起源はヒトの祖先が社会生活を始めた直後にまでさ かのぼることが可能かもしれない。他人の心を読む手段として、ここ 100 年は生体信号(呼吸・脈拍・血圧・発汗・脳波・筋 電・心電・眼球運動・血流量など)が大きく注目されており、嘘発見機におけるポリグラフや脳から直接に機械を操作する BCI 技術などがその代表的な例である。近年は計算機や数学の発達により大規模データの取り扱いが可能になり複数の生体信号を 同時に計測し解析することが容易になった。 [問題点]心の読解のための生理指標の利用は、まだまだ発展途上であり一般的な方法ではない。BCI 技術はまだまだ生活に身 近なものというにはほど遠く、ポリグラフによる嘘発見機もそれ自体が裁判での証拠になるほどには信用されていない。この ように生体信号の解析による心の読解には一種のうさんくささが付きまとい、その効果が広く周知されているとは言いがたい。 また、心の読解に生体信号がどこまで有用なのかについても議論の余地がある。 [目的]本プロジェクトは、生体信号解析による結果(図 1)が、人が勘や経験に基づいて下した結果(図 2)、言い換えれば人の 目による判断よりもよりよく他者の意思を反映することを示すことを目的とする。これにより、生体信号解析の有用性を明確 に示すことができ、生体信号の工学的応用や研究が一段と進歩しやすい環境づくりを目標にする。また、本プロジェクトでは 可能な限り多くの生体信号を同時に測定し解析することを目指す。ひとつには生体信号の有用性の周知といった目標から生体 信号というものには多くの種類があることをわかりやすくするため。もうひとつには近年の計算機や数学の発展により大規模 のデータの取り扱いが容易になったことが多種類の生体信号を使用する理由として挙げられる。 図 1:生体信号解析による他者の心の読解 図 2:人による他者の心の読解 [手段]本プロジェクトではトランプゲームの一種のポーカーを題材にして人間の意思決定を予測する。題材にトランプゲーム を用いる理由として、一般的に身近で親しみが持ちやすいことと、他者の心の読解がゲームの重要な要素であるため生体信号 解析での心の読解が有用であることが挙げられる。用いる生体信号は利用できる全てを用いる。最低限、脳波と嘘発見機によ く使用される皮膚電気反応は測定する。 7.目的到達までの研究計画 1. 実験開始の準備 8 月 生体信号データの収集の前に生体信号データを入手できる環境づくりを始める。まず、生体信号データを計測するため の機械が必要である。道具の内、いくつかは NAIST 内での体計測プロジェクトや連携講座、他大学の研究室にあるもの をレンタルすることを考え、それが叶わないのならば予算内で購入できるものだけ購入する。また、レンタルでは入手 できなかったものに関しては予算が許す限り購入をする。計測のための機械がそろったらそれぞれの機械の使用方法や 各種生体信号計測の手順や注意点を学び、それらの機械を用いて適切な生体信号の入手を可能にする。 2 現在、有用な生体信号として考えられるものとして以下のものが挙げられる。 ① 脳波(または脳血流量) 意思決定に関わることなので可能な限り脳情報を習得したい。脳血流量は長期測定や他の生体信号との同時計測が困 難なため、脳波を用いる予定である。 ② 皮膚電気 嘘発見機によく用いられる生体信号で、主に発汗を測ることができる。 ③ 心電、脈拍、血圧 自らの経験から、ブラフ(カードが弱いにも限らず強そうに振る舞うこと、またはその逆)をしているときは心臓の 鼓動がはやくなる。このように心臓の活動になんらかの変化が生じたさいにその変化を読み取れる生体信号が必要で ある。 ④ 筋電 主に顔の筋肉の動きを測定する。ポーカーフェースという言葉があるように、トランプゲームの最中には随意的に顔 の筋肉活動を抑えることがあり、その反応が取得できるのではないかと期待する。 ⑤ 呼吸 個人差はあるもののブラフをしているさいに呼吸が荒くなる人がいる。一般にエネルギー消費量を測る為の生体信号 であるが、ブラフなどのさいにはより多くのエネルギーを必要とする可能性が否めない。 2. 実験 9 月前半から 実験参加者を募集する。あまり大勢の実験参加者は必要ないが、複数名いたほうが望ましい。実験では実験参加者に実 際のルールに基づいたトランプゲームを行なわさせ、可能な限りの生体信号とビデオ等で行動についてのデータをとる。 実生活での応用が目的のため生体信号にノイズが多少入っても実験参加者には自然に振る舞わってもらう。 3. データ解析 9 月後半から 11 月 実験により得られたデータから解析を行なう。簡単な解析は中間発表までに済ませておく。得られたデータから、実験 参加者がブラフをはっているか等の心理状態を予測する。過去の知見に基づきそれぞれの生体信号から有用な特徴量の 候補をリストアップし、教師付き学習のアルゴリズムを用いて生体信号から心理状態を精度よく予測するモデルの作成 が目的である。 4. アプリケーション作成 12 月 本プロジェクトは、人の目による判断と生体信号から得られた結果の比較である。そのため実験で得られたビデオなど の行動データから、実験参加者の心理状態をユーザーが予測するアプリケーションを作成する。このアプリケーション を用いることにより後述の人の目と生体信号解析によって得られた予測モデルの比較を行い、また 3 月のスプリングセ ミナーでのポスターセッションのさいのデモとしてこのアプリケーションを利用する。 5. 生体信号解析と人の目の比較 1 月から 3 月 生体信号解析によって得られた予測モデルがどれほど有用かを確かめるため、実験参加者の行動データから人の目によ って実験参加者の心理状態を予測した場合との比較を行なう。例えば、ブラフをしているさいにまばたきの頻度が大幅 に上昇する人がいたらどうだろうか?彼の心理状態がブラフか否かは生体信号(例えば顔の筋電)から簡単に予測でき ることが予想されるが、生体信号なしでも見た目で予測することができ生体信号の必要性を感じられない。そのため、 生体信号の有用性を示すためにも人の目による判断との比較を行なう。 3 8.決算の要約(※2末に確定。3月上旬に決算書を受け取り、記入すること) 金額(千円) 支出予定 品名・型名・数量/行先・目的・日数等 月 設備備品費 ※行が足りない場合は、XXX一式でよい ※その場合、詳細は結果報告に記入してよい 消耗品費 197,610 10-3 月 PC 一式 192,473 10-3 月 書籍 55,271 10-3 月 実験用器具一式 ※その場合、詳細は結果報告に記入してよい 旅費(調査目的も可) 29,400 10 月 東京.生体信号計測の市場調査 ※行が足りない場合は、XXX一式でよい ※その場合、詳細は結果報告に記入してよい 474,754 合計 9.プロジェクトの状況および自己評価の要約 [達成できたこと] 1. 生体信号を用いた嘘発見機の作成 2. デモの形での「生体信号」での嘘判断と「人の目」での嘘判断の正答率の比較 3. 生体信号の有用性の啓蒙 4. 実際に自分の脳波を見ることのできるデモ [当初の予定との差異] 1. 用いた生体信号が脳波だけであったこと 2. 実験デザインが当初想定していたものよりも自然状態から遠いものになったこと [自己評価] 当初の予定との若干の差異はあるものの本プロジェクトの目的である, (1)生体信号による嘘 発見機の作成, (2)嘘発見機の性能と人間が見た目や音で判断した場合の性能との比較,は達成 された.本プロジェクトによって,脳波と脳波データの解析方法(信号処理,機械学習)の有用 性をスプリングセミナーやオープンキャンパスでのデモを通した啓蒙に成功したといえる.ま た,本プロジェクトで作成した嘘発見機の性能が人の目による判断よりも優れていることが実証 でき,脳波嘘発見機の工学的な価値を確かめた. 4 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 人の目 VS 生体信号解析、どちらが人の心を読めるのか プロジェクトリーダ 大杉直也 1.概要(背景と狙い) 他人の心を知りたいという欲求は人類普遍 2.プロジェクトの進捗 のものであろう。その起源はヒトの祖先が社 本プロジェクトは「生体信号を用いた嘘発 会生活を始めた直後にまでさかのぼることが 見機」と「人の目による嘘発見」の性能比較 可能と考えられる。他人の心を読む手段とし を行った.そのため(1)生体信号を用いた嘘 て,ここ 100 年は生体信号(呼吸・脈拍・血 発見機の作成,(2)人の目によって嘘を見抜 圧・発汗・脳波・筋電・心電・眼球運動・血 くための動画撮影,の 2 点を実現することが 流量など)が大きく注目されており,ポリグ 必要不可欠であったため,生体信号計測下で ラフを用いた嘘検出や脳から直接に機械を操 嘘をつかせるための実験を行った.なお,本 作する BCI 技術などがその代表的な例である. プロジェクトでは生体信号として脳波を用い しかし,生理指標の心の読解のための利用は, た.脳波を用いた理由として昨今の脳ブーム まだまだ発展途上であり一般的な方法ではな による脳波への関心の高まりや脳波自身が心 い.BCI 技術はまだまだ生活に身近なものと の状態を反映すると考えられる指標であるか いうにはほど遠く,ポリグラフによる嘘発見 らであった. 機もそれ自体が裁判での証拠になるほどには [実験] 信用されていない.このように生体信号の解 メンバーの 1 人を被験者とし実験をした. 析による心の読解にはある種のうさんくささ 脳波は能動電極を用いて計測され,Pz(10-20 が付きまとい,その効果がどの程度のものな 法)の箇所のみを計測した. (サンプリングレ のか広く周知されているとは言いがたい.ま ート:100Hz, リファレンス:右耳朶)実験中は た,心の読解に生体信号がどこまで有用なの 筋電や眼電位などのアーティファクト由来の かについても議論の余地がある.そこで,本 ノイズ成分が脳波計で計測されないように安 プロジェクトは,生体信号解析による結果(図 静にするよう教示をした.被験者への音刺激 1)が,人が勘や経験に基づいて下した結果より は全てヘッドフォンを通して行われ,音刺激 も他者の意思を反映することを示すことを目 中は閉眼するよう教示した.実験の様子は被 的とした.これにより,生体信号解析の有用 験者の正面 30cm ほどの距離に設置されたビデ 性を明確に示すことができ,生体信号の有用 オカメラによって記録された. 性の啓蒙や工学的価値の確認が達成された. 図 1:生体信号解析による他者の心の読解 5 図 2:設置した電極の位置.赤丸で囲まれた箇 が確認できた. 所に設置.人の頭を上から見た図で上が鼻. 計測された脳波は全てオフラインで解析さ 実験の手続きを以下に記す. 1. れた.解析には MATLAB(MathWorks 社)を用い 被験者は 1,2,3,4 が書かれたトランプを た. 1 枚ずつ, 計 4 枚の中から 1 枚を選んだ. 2. 脳波から嘘発見機を作成したアルゴリズム 選んだトランプを何の数字かがビデオカ を以下に記す. メラに写らないように手元にふせておか 1. せた. 3. から+700ms の間の脳波データを用いた. 「いち,ですか?」, 「にぃ,ですか?」, 2. 「さん,ですか?」 , 「よん,ですか?」 5. 3. 1Hz から 40Hz のバンドパスフィルター(4 で被験者はその度ごとに「いいえ」と答 次のバターワースフィルターを使用)を えるように教示された. かけた. ふせておいたトランプを,そこに書かれ 4. FFT を用い,パワースペクトルを求めた. た数字が何かをわかるようにビデオカメ 5. 1 セット分の脳波データをテストデータ ラに向けた. とし,残りの 9 セット分の脳波データを ふせたトランプの数字と同じ数字につい トレーニングデータとして用いた. て何回目に質問されたかを答えさせた. 6. 嘘条件の脳波データに 1,ダミー条件の 脳波データに 0 とラベル付けを行った. といった音刺激(質問)が順番に鳴るの 4. 音刺激呈示開始時刻を 0ms とし,+300ms 6. トレーニングデータの脳波データのパワ 以上を 1 セットとして,これを 10 回繰り ースペクトル(2Hz から 15Hz)までを入 返した.なお,音刺激の鳴った順番はセ 力とし,条件ごとにつけたラベルを教師 ットごとに異なった. としたロジスティック回帰分析で嘘発見 以上,ここまでが実験の呈示手順である. 機モデルを学習した. この実験における“質問された数字が自分の 7. このモデルをテストデータで用い,出力 ふせたトランプと同じ数字だった場合に質問 が最も高い脳波データを嘘条件のものと 後に「いいえ」と答えた場合”を嘘条件とし, 推測し,残りの 3 つはダミー条件だと推 “質問された数字が自分のふせたトランプと 測した. 違う場合に質問後に「いいえ」と答えた場合” 8. これらの操作をテストデータに用いるセ をダミー条件とした.実験手続きにおいて, ットをかえながら 10 回行い,全体の正答 ふせたトランプの数字と同じ数字について何 率を求めた. 回目に質問されたかを答えさせた理由として 以上,ここまでが脳波データからの嘘発見 (1)ふせたトランプの数字を被験者が記憶し 機作成アルゴリズムである.音刺激呈示開始 ていたこと,(2)被験者が質問をしっかり聞 から+300ms から+700ms の時間窓のデータを解 いていたこと,を確認するためであったこと 析に用いた理由として,本実験のデザインか が挙げられる. ら P300 や N600 の ERP が嘘条件には出現され [結果] ると考えられたためであった.この嘘発見機 被験者は,ふせたトランプの数字と同じ数 作成アルゴリズムでの嘘検出率は 60%であり, 字について何回目に質問されたかについて チ ャ ン ス レ ベ ル の 25% を 大 き く 超 え た 100%正答した.このことから(1)ふせたト (p<0.01).このことから本プロジェクトで嘘 ランプの数字を被験者が記憶していたこと, 発見機作成に成功したといえる. (2)被験者が質問をしっかり聞いていたこと, 6 結論できる. 4.今後の展開 本プロジェクトにより生体信号の有用性の 啓蒙に成功した.啓蒙活動によって生体信号 の有用性が広く認知されることによって生体 信号計測の進歩や解析技術の発展が見込まれ る. 本プロジェクトで用いられた脳波嘘発見機 図 3:条件間での脳波データの加算平均.ERP の性能は 60%で,人の目による判断と比較し らしき波形が見て取れる. て十分に高いとはいえ,例えば司法の場で証 [デモでの様子] 拠として用いられるかと問われれば 60%の性 実験中に撮影した動画を来場者が見て,1 セッ 能は高いとはいえない.また,実験に用いら トの内のどこで嘘をついたかを推測させた.その れた脳波計は高価なもので一般向けに利用し 結果,全体を通しての正答率はほとんどの来場 やすいとはとてもいえない.今後,アルゴリ 者は生体信号による嘘発見機と比較して低い成 ズムや実験デザインの改良により性能の向上 績であった.50 人の参加者が本嘘発見機よりも や,より安価で高性能なアンプや電極の開発 低い成績で 1 人が嘘発見機以上の成績であり,2 が望まれる. 人で同等の成績であった.このことから本嘘発見 5.自己評価 機では見た目では検出が困難な嘘の検出に成 結果がしっかりしたものが出せたので本プ 功したといえた.また,デモではメンバーの一人 ロジェクトに対しての自己評価は高いものに の脳波を実際に表示して来場者に脳波計測とは なっている.当初,予定していた皮膚電位を どのようなものかを説明した.平行して一般に市 含めた「可能な限り多くの生体信号測定」や 販される脳波計とそのアプリケーションも来場者 「自然状態に近い状態での実験」を予算や時 に体験してもらい,その機器の有用性と怪しい箇 間の都合により断念した.そこで本プロジェ 所の説明を行った. クトの原点である「生体信号による心の読解 3.成果 と人の目による心の読解の性能比較」に立ち 本プロジェクトの目的である「生体信号と 返り「脳波による嘘発見機」を作成した.結 人の目のどちらが人の心を読めるか」を実証 果的にこの変更はプラスに働きスプリングセ するため「心の読解」のひとつである嘘発見 ミナーやオープンキャンパスでの成功につな 課題を用いて「生体信号による嘘発見機」と がった. M2 の身であったため修論や院試と平 「人の目による嘘発見機」の比較をした.そ 行しながらのまとまった時間のとりにくい環 のために「脳波による嘘発見機」を作成し, 境で限られた予算でプロジェクトを完遂した 実際に嘘を脳波から見抜くことに成功した. メンバーには賛辞を述べたい. このことから本プロジェクトには工学的価値 があったといえる.また,脳波での嘘発見機 の性能の良さをデモによって来場者に実感を もって伝えることに成功し,生体信号の有用 性についての啓蒙ができた.本プロジェクト は来場者の評価も高く,投票の結果 3 位にな ったことからも本プロジェクトは成功したと 7 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」研究提案要旨 1.プロジェクト名 Emotion and Stress Detection Using Social Networking and Mobile Applications 2.プロジェクトリーダー 所属講座 学年 Computational Ling. 学生番号 氏名 D2 0961027 Erlyn Manguilimotan 学年 学生番号 氏名 D2 0861209 Marie Engelene Obien e-mail アドレス [email protected] 3.分担者 所属講座 Comp. Design & Test e-mail アドレス [email protected] 4.チューター 所属講座 職名 Computational Linguistics Dr. 氏名 Mamoru Komachi 5.必要経費(※ここまで、交付申請の内容をそのまま記入すること。1ページに収めること) 金額(千円) 設備備品費 消耗品費 旅費(調査目的も可 合計 支出予定月 品名・型名・数量/行先・目的・日数等 ¥94,800 August Macbook 13in 2.4 GHz ¥94,800 August Macbook 13in 2.4 GHz ¥48,800 August iPad WiFi 16GB ¥63,800 October Mac Mini 320GB ¥6,800 October Apple Wireless Keyboard ¥6,800 October Apple Magic Trackpad ¥14,800 October スント t1c 心拍計 ¥2,000 October セイコーポケット歩数計ピンク WZ510-P ¥3,000 October タニタ歩数計 PD-638-BK ¥21,800 August 英語 MS Office Student & Home Edition ¥10,000 October Apple Developer Program ¥60,000 October EMNLP Conference Registration ¥233,040 August Air Fare ¥100,000 October Hotel ¥21,560 October Transportation ¥15,000 August US Visa Application ¥797,000 6.プロジェクトの背景と目的 8 The study of emotions and stress has been prevalent for years because of interests on the factors that affect them and their effect on productivity and performance. The effect of stress on productivity is aptly explained by the Yerkes-Dodson Law shown in Fig. 1, which argues that as stress increases, performance is enhanced up to a certain point and Figure 1. Yerkes-Dodson Law then, it declines thereafter. Although people can determine if they are currently undergoing stress or are being emotional as of the moment, it is not certain that they know immediately how to deal with it. We consider that personal monitoring and knowledge of one’s emotions and stress levels as well as understanding these information can help the person manage his or her life towards productivity and better performance. There have been several works and approaches to detect positive and negative emotions and stress, most of which involve heavy and expensive equipment. It is our aim to be able to equip the person with a mobile tool that determines his or her current stress level and emotion, which can be used naturally and integrated as seamlessly as possible to a person’s normal everyday activities. This project proposes a social networking and mobile solution which extracts data from the person through his or her Facebook status updates and/or Tweets (Twitter) and from physical motion data gathered using a mobile smartphone with accelerometers. For this proposal, we plan to use both iPhone and Android phones to detect motion and send the data to a central server. Thus, this project is initially divided into two parts: (1) text analysis to identify emotions and detect stress and (2) characterization of motion patterns that indicate emotional states, physical stress, and possibility of breakdown. Then, these two will be integrated to create a mobile application and online database, which is our solution towards emotion and stress management. Recently, the use of social networking websites such as Twitter and Facebook has been very popular to people of all ages. In fact, Facebook has almost 500,000,000 users worldwide. These social networking avenues are being used to express how the users currently feel, what they are currently doing and thinking about, and some information they want to share with others. Such expressions are given in the form of Tweets and Status Updates, which can be set to be available to anybody or just to friends. In this project, we try to exploit the availability of this rich source of data to extract emotion and stress information. The first novelty of our work is emotion classification of social networking data, which has not yet been done. The advantage of using social networks is the user’s frequency of use due to straightforward methods of inputting short messages. Emotion will be determined for each status update or tweet of the user. In this project, we use the APIs of Facebook and Twitter to connect user accounts of these networks to our system. Messages will be analyzed by our central server. Furthermore, the boom of smartphones is prevalent recently and these are usually the ones that users keep close to themselves. Thus, we utilize the motion (accelerometers) and location (GPS) sensors in these devices to record the movement of a person in which location. The user may also indicate GPS locations 9 for both Home and Work in the application that we will create. There are similar apps like the Nike Pedometer on iPods/iPhones, but this needs an external device to work. The second novelty of this work is the use of the mobile phone itself to detect and record motion. Moreover, our app will run at the background, which means normal operations such as calling, sending message, checking mails, etc. can still be done by the user. Our application is connected to a central server, where the data from the phone and the social networking websites of the user will be fed to for storing and analysis. From the server analysis, the app can give alarms to the user as stress warnings, which indicate that the user is stressed beyond the optimal productivity limit and may break down soon. In such cases, the user will know that it is better to stop, take a rest, meditate, talk to a friend, or do many other ways in order to shift back from an agitated stressful state to a fresh, positive start. Through our system, the user can view his or her emotional conditions and stress levels in a timeline and in different locations anytime, anywhere. This way, the user can be aware of own indicators of breakdown and manage activities to perform better. It is a breakthrough in today’s world to have a mobile personal emotion and stress management solution, which will allow users to live a lifestyle of increased productivity. 7.目的到達までの研究計画 10 8.決算の要約(※2末に確定。3月上旬に決算書を受け取り、記入すること) 金額(千円) 設備備品費 248,199 支出予定月 August 品名・型名・数量/行先・目的・日数等 2 Macbook 13in 2.4 GHz 1 iPad WiFi 16GB 英語MS Office Student and Home Edition 128,998 October 1 iPad WiFi 16GB 1 Apple Wireless Keyboard, 1 Magic Trackpad Mac Mini 2.4Ghz Intel Core Duo 2 Apple Mini DisplayPort -VGA 3,570 December Pedometers セイコーポケット歩数計 ピンク WZ510-P, タニタ歩数 PD-638-BK 消耗品費 旅費(調査目的も可) 合計 39,220 October EMNLP Conference Registration for 2 persons 242,720 October Air Fare to Boston for 2 Persons 94,666 October Hotel Fee for 2 for 5 days 757,373 11 9.プロジェクトの状況および自己評価の要約 The objective of this project is to be able to give a user feedback regarding his or her current emotion status and stress level through a mobile phone application. It proposed the use of social networking websites to extract data from user such as Facebook and/or Twitter status updates and from physical motion data gathered using a mobile smartphone with accelerometers. Thus, this project, as initially proposed, is divided into two parts: (1) text analysis to identify emotions and detect stress and (2) characterization of motion patterns that indicate emotional states, physical stress, and possibility of breakdown. Then, these two will be integrated to create a mobile application and online database, which is our solution towards emotion and stress management. First, we were able to develop an App that extracts data from a user’s Twitter account. Data is processed to determine the emotion associated with each twit or status updates from the Twitter account. The stress level of the user per twit is also computed using the semantic orientation values of words, as well as the average stress of the person per day. The second part of the project was not realized. Though motion patterns can be extracted from iPhones using its motion sensor, we prioritized the extraction of text data for it is the core of the project. The use of motion data was thought only as a support of any physical stress that a person could experience. 12 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 Emotion and Stress Detection Using Social Networking and Mobile Applications プロジェクトリーダ Erlyn Manguilimotan 1.概要(背景と狙い) Social networking websites, such as Twitter and The study of emotions and stress has been prevalent Facebook, are used by millions of people nowadays for years because of interests on the factors that as a venue for expressing what they feel. affect them and their effect on productivity and performance. The effect of stress on productivity is aptly explained by the Yerkes-Dodson Law shown in Fig. 1, which argues that as stress increases, performance is enhanced up to a certain point and then, it declines thereafter. Figure 2 According to some statistics, as shown in Figure 2, Post Personal Updates recorded 72% of the total activities in Twitter [2]. As of June 2010, Twitter has Figure 1 190 million users tweeting around 65 millions times a Negative emotions are also strongly related with day [3]. stress. Feelings of anxiety, anger, embarrassment, These figures are overwhelming. Other works already and hostility are emotional responses to stress [1]. made use of Twitter data for sentiment analysis such as On the personal level, people experience stress in the work in [4] and [5]. However, tweets in these different situations. It can be a relationships between works are classified as positive or negative emotion love ones, too much work, or some depressing only according to context. In this work, we also made situations such as death of a family member. use of user updates from Twitter. Instead of classifying In this work, we are interested in being able to tweets as positive or negative, we tried to classify manage ones stress on a personal level. Awareness tweets using six emotion classifications as listed in [6]. of one’s emotions and stress level prevents individuals from reaching the breakdown point of 2.プロジェクトの進捗 stress that can lead to anxiety and/or depression. We The original plan of the project is divided into two aim to be able to equip the person with a mobile tool parts: (1) text analysis to identify emotions and that determines his or her current stress level and detect stress and (2) characterization of motion emotion, which can be used naturally and integrated patterns that indicate emotional states, physical as seamlessly as possible to a person’s normal stress, and possibility of breakdown. everyday activities. On emotion and stress detection, iPhone application, 13 called EmoTweet, was developed. Sections 2.1, 2.2 1 and 2.3 explain details about the application. Ave Stress level per day However, the second part of the proposed project was not implemented. Though motion patterns can Emotion be extracted from iPhones using its motion sensor, 3 we prioritized the extraction of text data for it is the core of the project. The use of motion data was 4 2 thought only as a support of any physical stress that Tweet, date and time a person could experience. Stress level per tweet 2.1 EmoTweet iPhone App The concept of emotion and stress detection is implemented as an iPhone application. Figure 3 shows a screenshot of EmoTweet, an iPhone application to determine emotion and stress level of a person. The App retrieves the status posted by the Figure 3: Screenshot of EmoTweet user using RSS (Really Simple Syndication) feeds. Sections 2.2 and 2.3 discusses on how emotion and Twitter, a social networking and a microblogging stress level are determined from the user’s tweets. website where people write about “what they are For the purpose of this project, we only access doing” [4], has about 190 million users according to public Twitter accounts. Private accounts will come an online article [3]. User status updates or posts as part of the future development of this project. are called “tweets”. In this paper, we use the same term to refer to user status updates. In the figure, the following information is displayed in EmoTweet’s screen: 1: Average Stress Level at the current time and date. 2: User tweet and time 3: Emotion classified for each tweet 4: Stress level per tweet. The App asks for the Twitter account, as shown in Figure 4 and returns 20 status updates through Twitter’s RSS (Really Simple Syndication) feeds. Figure 4: Twitter Username Request 2.2 Emotion Classification To determine the emotion associated to each tweet, a dictionary of emotion words is used. A linguistic resource, called AFFECT [4], is used as lexical 14 database of emotion-related words. AFFECT is a lexical database directly or indirectly referring to emotional state. Words in the database are annotated with six emotions: anger, disgust, fear, joy, sadness, surprise. Each word in a tweet is searched from the database. If a word is found in the database, the emotion category is retrieved and tweet is classified using that category. In cases where two or more emotion Figure 5: Process for Determining Emotion and Stress Level categories are retrieved, we count the occurrences of each category found and return the category with the 3.成果 most number of occurrences. As shown earlier in Figures 3 and 4, EmoTweet, an 2.3 Stress Level emotion and stress detection iPhone application has Following Takamura’s [7] work on semantic been implemented. The application determines orientation of words, each word in tweets are emotion as supposedly express in the tweet by searched from a lexicon. Each entry in the lexicon is searching for some trigger words in the tweet as associated with some numerical values in the range explained in Section 2.2. Due to some limited -1 to +1, where the words assigned with values close resources, i.e. annotated corpora for emotion, deeper to -1 are supposed to be negative and +1 for words semantic analysis has not been done for this work. that are supposed to be positive. These values are Building our own annotated data takes time. As a considered as stress values where positive values result, the system cannot distinguish negated imply less stress and negative values increase stress emotions such as in the tweet “The weather is not so level of a tweet. Words that are not in the lexicon good today. It might rain” in Figure 6 which was are assigned with zero value. However, these words classified as “JOY” instead of “SADNESS”. are not included in the computation of the average stress per tweet. Stress level per day is computed as the average of the stress levels of all tweets of the current date. Only the stress level of the current day Figure 6: Ambiguous Classification of Emotion of Tweet is computed as we assume that the previous day’s stress level is not very relevant on the current stress 4.今後の展開 level and emotional state. Figure 5 shows the For our future work, we want to include some syntactic process of determining emotion and stress level. and semantic analysis on our application instead of merely searching trigger words from our lexicon. With this, we will be able to capture the real emotion expressed by a tweet. Daily stress level in the application is displayed as a label on top of the App’s window. A more visual analysis of stress level will be more interesting and more useful for the user. We plan to add a bar graph in our App indicating stress level for 15 the day. Aside from the day’s stress level, we want to [1] Emotion and Stress . Available [Online : http://www.parkerphd.com/PDFs/SG_09.pdf] add information on the user’s stress level for the week, and a summary of the month’s stress level. The current [2] Social Media Science: The Five W’s of Twitter Marketing. Available [Online : http://www.designdamage.com/social-media-sc ience-the-five-ws-of-twitter-marketing/] App was developed for iPhone. We plan to extend it to iPad and maybe Android phones in the future and integrate motion data to our future App. Lastly, we want to include private Twitter accounts and set a more [3] Costolo: Twitter Now Has 190 Million Users Tweeting 65 Million Times A Day. Erick Schonfeld. 2010. Available [Online : http://techcrunch.com/2010/06/08/twitter-190million-users/] secure feature in accessing these accounts. 5.自己評価 With respect to our original aim of the project, we [4] Twitter Sentiment Classification using Distant Supervision. Go, Alec, R. Bhayani and L. Huang. 2009. Available [Online: http://www.stanford.edu/~alecmgo/papers/Twit terDistantSupervision09.pdf] were able to develop the mobile application that determines emotion and stress level from social networking websites. However, there are further improvements needed to achieve more accurate classification of emotion and a more interactive mobile [5] Twitter Based System: Using Twitter for application especially on showing the stress level of a Disambiguating user. Adjectives. Pak, A. and P. Paroubek. 2010. In The idea of using motion patterns through the iPhones Proceedings of the 5th International Workshop accelerator was not implemented. We prioritized text on Semantic Evaluation, ACL 2010, pages processing over motions for we felt this is the text data 436-439, Uppsala, Sweden. Sentiment Ambiguous is the core data of our work. In our schedule, we planned to implement the [6] WordNet-Affect: an affective extension of application on an Android phone. After certain WordNet. financial evaluations and other issues on acquiring Alessandro Valitutti,. In Proceedings ofthe 4th Android phones (i.e. Telecoms contract) and different International platforms, we decided to concentrate on iPhone Resources and Evaluation (LREC 2004), development since both researchers own iPhones and it Lisbon, May 2004, pp.1083-1086. 2004. Carlo Conference Strapparava on and Language might take some time to develop on two different platforms. [7] Extracting semantic orientations of words On another aspect, CICP has brought many good using spin model. Takamura, H., T. Inui, and M. experiences for us. This project broadened our Okumura. 2005. In Proceedings of ACL '05 knowledge, not only on semantic analysis but also on Proceedings of the 43rd Annual Meeting on psychological facts about emotions and stresses. On Association for Computational Linguistics. the technical aspect, it gave us an experience on developing applications for mobile phones. We came across challenges along the way, but in the end, our experience taught has many things. References: 16 2010「特待生プロジェクト」提案書 1.プロジェクト名 身体情報を用いたライフシミュレーション 2.プロジェクトリーダー 所属講座 生命機能計測学講座 学年 学生番号 氏名 e-mail アドレス M1 1051012 井元 兼太郎 [email protected] 3.分担者(※他大学の学生も可.分担者無しも可) 所属講座 学年 学生番号 氏名 e-mail アドレス 生命機能計測学講座 M1 1051066 田中 達規 [email protected] 放射線機器学講座 M1 1051072 富永 貴則 [email protected] 生命機能計測学講座 M1 1051024 小田 裕也 [email protected] 4.チューター 所属講座 生命機能計測講座 職名 氏名 e-mail アドレス 助教 佐藤 哲大 [email protected] 5.必要経費(※応募時点での見積書添付は不要) 金額(千円) 設備備品費 支出予定月 75 8 月 品名・型名・数量/行先・目的・日数等 サ ー バ 用 パ ソ コ ン ( Pavilion Desktop PC HPE-280jp/C) 90 8 月 アプリケーション開発兼デモ用ノートパソ コン(VAIO E シリーズ VPCEB28FJ/B) 消耗品費 30 8 月 書籍 20 8 月 運動強度測定装置(Wii) 10 8 月 運動強度測定装置(Wii Fit) 50 8 月 健康情報出力装置(iPad) 5 12 月 脈拍計(Wii Relax) 5 8月 血圧計 25 8 月 記録用メディア(DVD),消耗品(電池)、ケー ス 旅費 359 11 月 IMIA2010 Washington, DC USA(研究調査,5 日,2 人) 合計 669 17 6.プロジェクトの背景と目的 特定保健用食品の発展や,ゲーム機を通して運動できるソフトの登場など国民の健康に対する 意識は高まっている.しかし,医療の知識が少ない患者にとって自身の体について理解し,生活 習慣や身体情報から今後の生活を見直すことは非常に難しい.健康管理のニーズに応えるために は,日常生活に基づいて健康を管理すること,そこから現在の生活習慣を改善することが必要で ある.そこで我々は今までにない,詳細な健康情報を表示するライフシミュレーションシステム を提案する.ライフシミュレーションシステムとは現在の身体情報,生活習慣に基づいて未来の 体型を予想するシステムである.このシステムでは自身の健康情報に合わせて,生活習慣の管理 を電子的に行うことができる.また,現在の生活習慣や身体情報から未来の健康状態を知ること ができるため疾患の予防も行うことができる. 本プロジェクトでは比較的簡単に取得できる体重や身長,摂取カロリーなどの身体情報から体 重変化を予想し CG を用いて未来の体型を表示する web アプリケーションの開発を目指す.これ は体重などの身体情報から生活習慣病の兆候を気付かせるということ,そして健康改善をサポー トするということを目的としている.アプリケーション開発を行うにあたり通信機能のある体重 体組成計・血圧計などの健康機器や、携帯電話に付加されている歩数計などにより身体情報は簡 単に取得できると仮定する.入力データに基づき,数値やデータを解析して未来の健康状態を推 定する.推定結果に基づき,ユーザの自身の健康状態を画面上で 3 次元表示する.推定された体 型を CG で表示させることで健康管理の意識を高めることにつなげる.我々が提案するライフミ ュレーションは,日常における健康情報の管理を目的としているので,web を通じていつどこで もアクセスできるシステムを目指す. 7.目的到達までの研究計画 健康情報を用いたライフシュミレーションの開発を目的とする.目的の達成には以下に示す 4 つ のステップが必要となる. ① 体重変化シミュレーション ② 予想体型の CG 表示 ③ システム構築 ④ 評価実験と機能調整 開発スケジュールを図 1 に示す 図 1 開発スケジュール 18 ⑤ 【体重変化シミュレーション】 (~9 月下旬) アプリケーション開発を行うにあたり通信機能のある体重体組成計・血圧計などの健康機器 や、携帯電話に付加されている歩数計などにより身体情報は簡単に取得できる仮定する.システ ムの構成を図2に示す.体型変化シミュレーションを行うために体重変化に寄与する身体情報を 調べる.生理学に基づき体重変化に寄与する身体情報を決定し,さらに計測実験を用いて理論の 正当性を示す.開発初期段階ではサンプルデータとして開発者や研究協力者の生活習慣データを 利用しシステムのプロトタイプを設計する. 図 2 システムの構成図 ⑥ 【予想体型の CG 表示】 (~11 月) 体重変化シミュレーションにより体重の増減を予想することが できるため,この結果を用いて予想体型の CG 表示を行う.人体モ デルはフリーウェアである人体モデリングソフト makehuman を用 いて作成した.人体モデルのパラメータは身長,体重,体脂脂肪 率,年齢,性別の五つを設定した.これに加え時間と体重増加率 の概念を導入することで時間変化する体型を表現する. 図 3 体型モデル ⑦ 【システム構築】 (~3 月) 体型変化シミュレーションと予想体型の CG 表示を組み合わせたシステムを web アプリケーシ ョンとして構築する.体重や身長などの入力は自動を想定しているがスプリングセミナーのデモ のためアンケートを含めた入力項目を作成する. 【評価実験と機能調整】 (~2 月) 10 人程度に対して実験を行い,その結果に基づきシステムを調整する.スプリングセミナーで デモンストレーションを行う. 19 8.決算の要約 金額(千円) 設備備品費 消耗品費 支出予定月 76 1 8 月 サーバ用パソコン(HP Pavilion Elite) 8 月 書籍 28 8 月 運動強度測定装置(Wii) 54 8 月 健康情報出力装置(iPad) 4 60 旅費(調査目的も可) 品名・型名・数量/行先・目的・日数等 426 8 月 電池 2 月 カメラ(記録用) 3 月 IADIS e-Society2011 Avila,spain (研究調査,5 日,2 人) 合計(上限 1,000 千円) 651 9.プロジェクトの状況および自己評価の要約 本プロジェクトでは生活習慣を改善し疾患を予防するためのライフシミュレーションを提案 した.今回の企画では来るべきユビキタス社会を想定し,身体情報は健康機器や、携帯電話によ り自動で入力することを仮定している.しかしながら,現在の健康器具ではシステムを満足する だけの情報を集めることができない.そのため,自動入力が可能になるかという点がアプリケー ションとしてリリースする際の大きな課題となっている.特に,入力項目の中で自動取得が難し い項目は摂取カロリーであるといえる.しかし,画像から摂取カロリーを自動で計算する様な仕 組みが現在検討されておりこれの完成により,本システムの使いやすさも大幅に向上すると考え られる.また,当初の予定では体重の増減による体型変化も個人差を持たせる予定であった.し かし,被験者の体重変化が大きくなかったこと,被験者の人数が不足していることから実現する ことができなかった.太り方の個人差を表現するためには多くの被験者と,長期にわたる臨床実 験が必要となる.これらをライフシミュレーションに組み合わせることでさらなる健康意識の改 善が可能となると考えられる.また,最終的にはスマートフォンアプリとして身近に健康管理が できるアプリケーションを目指したが,時間的な問題により達成することはできなかった.もっ と綿密な開発計画を立て,各作業の期限や個人の役割を明確にすることで,円滑にプロジェクト を進めるべきであったと反省している.しかしながら,コンピュータ上で動くアプリケーション はほぼ当初の予定通り完成することができ,健康意識改善を促すシステムを作り上げることがで きた.この企画を通じて全体の計画を立てチームを動かすことの難しさを知ることができた.ま た,一年にわたるプロジェクト通して通常の研究では体験することができない貴重な経験をする ことができ,私を含めたメンバー全員の成長につながったと考える. 20 2010 年大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 身体情報に基づくライフシミュレーション プロジェクトリーダー 井元 兼太郎 1.背景 習慣病の疑いがあるということである.生活習 近年,コンティニュア・ヘルス・アライアン 慣病の進行の概略を図 3 に示す.生活習慣病の スに代表されるように家庭にある血圧計や体重 進行において肥満は生活習慣病の進行における 計、体温計などの健康機器や PET や MRI などの はじまりの部分に当たり, 生活習慣病をはじめ 医療機器に対してネットワークとの通信規格を として数多くの疾患の危険因子となっている. 定めようという動きがある.また,携帯電話に さらに,先進諸国では疾患の主要原因は肥満に も歩数計や脈拍計の機能が付加されており,今 よるものだと考えられている.生活習慣を改善 後は図 1 に示すように日常のあらゆるデータを すれば多くの疾患を予防することができるが, ライフログとして取得することができると予想 医療の知識が少ない患者にとって自身の体につ される.そのため,このようなユビキタス社会 いて理解し,生活習慣や身体情報から今後の生 に対応したアプリケーション開発が望まれてい 活を見直すことは非常に難しい.健康管理のニ る.そこで本プロジェクトでは疾患にかかる前 ーズに応えるためには,日常生活に基づいて健 に兆候を察知し対策を行う超防衛医療を促進す 康を管理すること,そこから現在の生活習慣を るアプリケーション開発を行う.アプリケーシ 改善することが必要である.そこで我々は今ま ョン開発を行うにあたり通信機能のある体重体 でにない,詳細な健康情報を推定表示するライ 組成計・血圧計などの健康機器や、携帯電話に フシミュレーションシステムを提案する. 付加されている歩数計などにより身体情報は簡 単に取得できる仮定する. 図 2 生活習慣病の推移 図 1 ユビキタス社会 現在,日本では高血圧や糖尿病,脂質異常症 などに代表される生活習慣病の患者が増加して いる.図 2 に厚生労働省による生活習慣病患者 数の推移を示す.この調査によると平成 18 年に おける生活習慣病の患者数は平成 14 年度に比 べ 2 倍近く増加していることが確認できる.こ れは日本における 20 歳以上の人口を 1 億 400 図 3 生活習慣病の進行 万人とすると成人の 2 人に 1 人が何らかの生活 本プロジェクトでは比較的簡単に取得できる 21 体重や身長,摂取カロリーなどの身体情報から つきがみられた.これは体重測定時間を一定に 体重変化を予想し CG を用いて未来の体型を表 しなかったため、食事などの影響を強く受けた 示する web アプリケーションの開発を目指す. と考えられる.そのため,正確な測定を行うた 体重などの身体情報から生活習慣病の兆候を気 めには起きた後すぐに体重を測定することが望 付かせるということ,そして健康改善をサポー ましい. トするということを目的としている.また,さ らなる健康意識改善のために食生活の評価も行 う. 2.プロジェクトの進捗 本プロジェクトでは体重変化に寄与する身体 情報を決定し,それに基づき体重の増減を求め る.身体情報の同定は生理学に基づき,さらに 計測実験を用いてその理論の正当性を示した. 人体モデルはフリーソフトウェアである人体モ デリングソフト makehuman を用いて作成した. 図 4 総差分カロリーと体重変化 本章では初めに人の体重が変化する仕組みと体 重の増減を決定する身体情報について述べる. 次に体型変化のパラメータについて述べ,体型 摂取カロリーと消費カロリーの求め方につい モデルの決定法を説明する.最後にシステムの て述べる.摂取カロリーは一日の食事から推定 構成について述べる. することができる.一方,一日の消費カロリー は基礎代謝カロリーと運動消費カロリーに大別 2.1 体重変化シミュレーション することができる.基礎代謝カロリーと運動消 1kg の脂肪は 7000kcal に換算されるため 費カロリーを健康情報から近似的に求めること 1kg の脂肪を落とすには 7000kcal の差分カロ を考える.まず基礎代謝カロリーモデルの求め リー必要とする.差分カロリーとは総摂取カロ 方を示す. 基礎代謝カロリーモデルには式 リーから総消費カロリーを差し引いたものと定 (2)(3)に示すハリスベネディクト方程式を用い 義する.これを用いると体重変化モデルは式(1) る. に示すように差分カロリーを 7000 で割り算し female 665 (weight 9.6) (height 1.7) (age 7.0) たものとして示すことができる. (2) male 66 (weight 13.7) (height 1.0) (age 6.8) ( Calorie difference weight chnage (1) 7000 3) 実際に記録したデータを図 4 に示す.X 軸は体 基礎代謝は女性と男性で大きく異なり,式(2)は 重変化,Y 軸は差分カロリーの総和を示す.グ 女性の基礎代謝,式(3)は男性の基礎代謝を示す. ラフより体重変化は総差分カロリーの影響を受 ハリスベネディクト方程式の計算には体重、身 けていることが確認できる.これより総摂取カ 長、年齢が必要となる. しかし,これは寝てい ロリーと総消費カロリーを求めることで体重変 るだけで消費するカロリーなので 日常生活で 化を推定することができると考える.しかしな 実際に消費されるカロリーはこれよりも多い. がら,総差分カロリーと体重変化の対応にばら 実際に消費されるカロリーは式(4)に示すよう 22 に基礎代謝を 1.2~1.4 倍した値と等しいとされ ている. (4) 1 日に消費するカロリーは生活習慣に対応して いるため蓄積されたデータより係数 k を決定す ることを考える.具体的には体重変化と差分カ ロリーより係数kを決定する.1kg=7000kcal という条件で体重変化がおこると仮定し係数k 図 6 体重変化シミュレーション を決定する.係数 k の計算式を式(5)に示す. 現在の摂取カロリーが消費カロリーを上回っ ているため体重が増加していく傾向にあること がわかる.グラフをみてわかるように体重変化 (5) により基礎代謝が変化するため無限に太り続け これにより一日に消費するカロリーを求めるこ るもしくは減りつづけることはない.現在の体 とができる.k の値が大きいほど普段の代謝が 重変化シミュレーションはデータが一カ月分し 大きいといえる. かなかったため平均的な変化しかあらわすこと 次に運度消費カロリーの計算方法について述 はできなかった.今後はより大きなデータを対 べる.運動は最も親しみが深いウォーキングと 象とした解析を行いより精度良い体重予想シミ ランニング の 2 つについて考える .ウォーキ ュレーションを目指す. ングの運動消費カロリーを式(6),ランニングの 運動消費カロリーを式(7)に示す. 2.2 体型変化シミュレーション 体重変化シミュレーションにより変化する体 (6) 重がわかるためそれを用いて人体体型モデルを (7) 変化させる.人体モデルはフリーウェアである ランニングやウォーキング以外の運動も考えら 人体モデリングソフト makehuman を用いて作成 れるが強い運動と弱い運動に分類しどちらかの した.makeHuman で作成した人体モデルを図 7 式に当てはめることとする. に示す.人体モデルのパラメータは身長,体重, 体重増加シミュレーションには摂取カロリー 体脂脂肪率,年齢,性別の五つを設定した.こ の平均,推定した一日の消費カロリー,運動消 れに加え時間と体重増加率の概念を導入するこ 費カロリーの平均を与えることで体重を予想す とで時間変化する体型を表現する. る.例として図 5 に示す被験者の体重増加シミ ュレーションの結果を図 6 示す. 図 5 被験者の身体情報 図 7 makehuman による人体モデリング 23 実際の表示画面では 5 年,10 年,15 年,20 年後と体型が変化する様子を確認できる.また, 最適摂取カロリーと現在の平均取得カロリーを 比較することで食生活を評価する.実際の表示 画面を図 8 に示す. 図 9 システム構成図 図 8 表示画面 2.3 システム構成 体型変化シミュレーションと予想体型の CG 表示を組み合わせたシステムを web アプリケー ションとして構築する.システム構成を図 9 に 図 10 身体情報入力画面 示す.本プロジェクトでは身体情報は健康機器 や携帯電話により自動で入力することを仮定し 3 成果 ている.そして,これを用いて長期的に蓄積さ 本章ではスプリングセミナー/オープンキャ れたデータより正確な健康状態を推定する.し ンパスおよび,IADIS2011 について述べる. かし,オープンキャンパスでデモンストレーシ ョンを行うために日常生活を調べる簡単なアン 3.1 中間報告会 ケートを含む入力項目を作成した.これにより 正確さには欠けるが簡易的に本システムを体験 CICP 中間報告として英語の口頭発表を井元 してもらう.アンケート項目を図 10 に示す.個 が行った.これまでにも何度か英語のプレゼン 人情報の入力画面は 2 段階用意している.第 1 テーションの経験はあったがネイティブの講師 段階としての身体情報入力には、性別、身長、 による評価と指導が得られたことは非常に貴重 体重、年齢、ウエストを設けている.第 2 段階 な経験となった.また,プレゼンテーションの は、生活習慣の情報を入力するアンケート画面 重要さを再確認することができた. を用意している.内容は日々の食事状況や嗜好 3.2 スプリングセミナー という摂取カロリー、運動頻度また煙草・お酒 プロジェクトの成果の一つとしてスプリング の摂取量も入力に求めている.これらから体重 セミナー/オープンキャンパスでデモを行った. 変化シミュレーションに必要な情報を得る. オープンキャンパスでのデモの様子を図 11 に 示す.本学学生,教職員,年輩の方々,そして 受験生など様々な性別,年代の方に興味を持っ 24 て頂き,普段の生活習慣を管理することの重要 性について知っていただくいい機会になったと 考えている.本システムを体験して頂いた方の 感想として「普段の食生活は食べ過ぎというこ とに気付いた」「食生活の改善を行う気になっ た」などご意見を頂き大きな励みとなった.一 方で「摂取カロリーの計算が煩雑」 「太り方の個 人差は表現できているのか」といった今後本シ ステムをさらに有益なシステムにするための貴 重なご意見を頂いた. 図 12 IADIS の発表風景 4.今後の展開 本プロジェクトでは生活習慣を改善し疾患を 予防するためのライフシミュレーションを提案 した.今回の企画では身体情報は健康機器や、 携帯電話により自動で入力することを仮定して いる.しかしながら,現在の健康器具ではシス テムを満足するだけの情報を集めることができ 図 11 オープンキャンパスでのデモ風景 ない.そのため,オープンキャンパスにおいて デモを行う際,身体情報の手動入力を行った. 3.3 IADIS2011 聴講報告 この時,入力情報が煩雑で使いにくいという指 2011 年 3 月 10~13 日にかけて 4 日間スペイ 摘を頂いた.実際に自動入力が可能になるかと ンのアヴィラで行われた IADIS において研究調 いう点がアプリケーションとしてリリースする 査を行った.その様子を図 12 に示す.IADIS2011 際の大きな課題となっている.特に,入力項目 では本プロジェクトと同様に iPhone などのモ の中で自動取得が難しい項目は摂取カロリーで バイル端末を利用した健康管理支援の研究が多 あるといえる.しかし,画像から摂取カロリー くみられた.特に診察予約サービスによる医療 を自動で計算する様な仕組みが現在検討されて 業務の効率化や健康レポートの送信による健康 おりこれの完成により,本システムの使いやす 意識改善が印象に残っている.e-society での さも大幅に向上すると考えられる. 発表の方向性は、 「 “e”から“m” 」つまりモバイ また,当初の予定では体重の増減による体型 ル環境でのアプリケーションや規約に関する研 変化も個人差を持たせる予定であった.しかし, 究へとシフトしていたように感じとった.本学 被験者の体重変化が大きくなかったこと,被験 会への参加から学んだ知見を今後の研究等で活 者の人数が不足していることから実現すること かしていきたい. ができなかった.太り方の個大差を表現するた めには多くの被験者と,長期にわたる臨床実験 が必要となる.我々の提案したライフシミュレ ーヨンに上記の技術を組み合わせることでさら なる健康意識の改善が可能となると考えられる. 5.自己評価 本プロジェクトでは生活習慣を改善し疾患を予 25 防するためのライフシミュレーションを提案し チューターである佐藤先生には本プロジェク た.その中でプロジェクとのプランニングと進 ト遂行に関して様々なご意見を頂きました.ま 行に関していくつかの問題があった.当初は た,COE プログラム情報研究拠点推進室の足立 wii-fit を用いて身体情報の取得を試みたが, 様には予算の執行の際,迅速で丁寧な対応を頂 インターフェースの悪さや測定項目の少なさか きました。ここに厚くお礼申しあげます.また, ら実際にシステムに組み込むことはできなかっ オープンキャンバス・スプリングセミナーにお た.しかし,現在市販されている健康管理商品 いてデモンストレーションに協力して頂いた研 の性能と問題を知ることができ,それをライフ 究室のメンバーにお礼申し上げます.また,体 シミュレーションに反映することができた.ま 重変化シミュレーションで快く実験に協力頂い た,最終的にはスマートフォンアプリとして身 た被験者の皆様にも厚くお礼申しあげます. 近に健康管理ができるアプリケーションを目指 なお,本プロジェクトは大学院教育改革支援 したが,時間的な問題により達成することはで プログラムによるものである. きなかった.プロジェクトを開始するに当たり 綿密な開発計画を立て,各作業の期限や個人の 役割を明確にすることで,円滑にプロジェクト を進めるべきであったと反省している.しかし ながら,コンピュータ上で動くアプリケーショ ンはほぼ当初の予定通り完成することができ, 健康意識改善に貢献する物を作り上げることが できたと考えている.この企画を通じて全体の 計画を立てチームを動かすことの難しさを知る ことができた.また,一年にわたるプロジェク ト通して通常の研究では体験することができな い貴重な経験をすることができ,私を含めたメ ンバー全員の成長につながったと感じている. 6.参考文献 [1]斉藤仙一,亀島英人,佐藤幸男“腹部断層画 像からの内臓脂肪面積の推定” ,電子情報通信 学会論文誌 D,vol.J92-D,No.11,pp2059-2066 [2]平成 18 年 国民健康・栄養調査の概要,厚生 労働省健康局総務課生活習慣病対策室 [3] Continua Health Alliance http://www.continuaalliance.org/index.html [4]情報通信で開く明日の健康と医療,電気四学 会 関西支部講演会論文集,平成 23 年 1 月 21 日 謝辞 26 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」研究提案要旨 1.プロジェクト名 クラウドを暴く可視化システムの開発 2.プロジェクトリーダー 所属講座 学年 学生番号 氏名 e-mail アドレス インターネット工学 M1 1051004 幾世知範 [email protected] 所属講座 学年 学生番号 氏名 e-mail アドレス インターネット工学 D1 1061002 榎本真俊 [email protected] インターネット工学 M1 1051036 神田慎也 [email protected] インターネット工学 M1 1051056 神宮真人 [email protected] インターネット工学 M1 1051117 森山京平 [email protected] 3.分担者 4.チューター 所属講座 職名 氏名 インターネット工学 助教 櫨山寛章 5.必要経費 金額(千円) 設備備品費 支出予定月 243 8 月 品名・型名・数量/行先・目的・日数等 PowerEdge ・ R410 ・ CPU XeonE5506 2.13GHz, Memory 8GB,HDD 1TB・2 台・ 実験環境構築 消耗品費 合計 43 8 月 24 型液晶ディスプレイ・U2410・1 台 15 8 月 HDMI-DVI ケーブル・KM-HD21-10・4 本 75 8 月 グラフィックカード・Geforce gtx470・2 個 18 8 月 2GB メモリ・D3U1333Q・3 枚 15 8 月 HDD・WD20EARS・1 個 16 8 月 ケース・CM690ⅡPlus RC-692-KKN1・1 個 25 8 月 マザーボード・P6X58D-E・1 個 30 8 月 CPU・Core i7 930 BOX・1 個 20 8 月 電源・CP-1000・1 個 500 27 6.プロジェクトの背景と目的 今日,さまざまな企業が独自のクラウドコンピューティング(以下,クラウドと呼ぶ)サービ スの提供を行っている.サービスの利用者は,実計算機環境を用意するよりも素早く簡単に仮想 的な計算機環境を用意できる.また,利用者は物理的な計算機環境の管理をする必要がない.一 方,このようなサービスを提供するために,サービス提供側には迅速な障害対応が要求されてい る.そのため,障害の原因を追及するためにシステムの稼働状況の可視化を行う管理者用のツー ルが企業などにより開発されている[2][3][4]. しかし,数千ノードからなるクラウド環境で障害が発生した場合,障害発生ポイントを即座に 特定することは現状では困難である.これは,クラウドが分散システムと仮想化技術の組み合わ せであり,図1(a)のような階層構造[1]をとることに起因する.クラウド環境は階層構造であるた め1つのレイヤから他レイヤの動作を知ることが困難である.また,仮想化技術で多重化されて おり,さらに処理分散が行われているため従来のように単一レイヤ毎に監視をするだけでは障害 の原因を即座に特定することができない. この問題を解決する手法の1つとして,レイヤ毎に取得した情報の関連付けを行い,クラウド 環境全体の振舞い(データや処理の流れ)を解析する手法が考えられる.そこで,本プロジェクト ではレイヤ毎にシステムサイドから振舞いを監視し,得られた情報の関連性を解析してクラウド 環境全体の振舞いを動的に可視化することに挑む.本システムを用いることで障害発生ポイント を迅速に特定し,マネージメント性を向上させることができるようになると考えている. [1]Cloud Security Aliance , Security Guidance for Critical Areas of Focus in Cloud Computing v2.1 [2]日本コンピュウェア株式会社「Compuware-Gomezソリューション」 [3]株式会社 東陽テクニカ「NetAlly」 [4]富士通株式会社「Trusted-Service Platform マネジメントサービス」 7.目的到達までの研究計画 本プロジェクトは主に「クラウド環境の構築と要求分析」と「クラウド環境からのデータの取得」, 「データの解析および可視化」の 3 つのフェーズで構成されている. 「クラウド環境の構築と要求分析」では,作業を進めるに当たり最初に Amazon サービスにお けるクラウドの構成[5]を参考に図 1(b)のようなクラウド環境の構築を行う.Hadoop の上では大規 模データから指定されたワードを検索する独自アプリケーションを動作させることを予定してい る.構築したシステムを運用する過程で実際にクラウド提供側がマネージメントをする上でどのよ うな情報を必要とするのかを明確にする. 「クラウド環境からのデータの取得」では実際に構築したクラウド環境からデータの取得を行 う.現在,各レイヤでは図 1(c)に示した情報が取得できる見込みがある.要求定義を満たす可視化 を行うために不足している情報がある場合は追加で取得する. 「データの解析および可視化」では取得したデータをまず個々に可視化する.その後さらに,こ れらを関連付けて要求定義に合うようシステム全体の処理とデータの流れなどの可視化を行う.こ れが本プロジェクトの重要な課題である.ここでは,クリックなどの動作に従い詳細な情報を表示 する仕組みを実現する.このような可視化を実現するため,UI 開発フレームワーク Qt を利用し 28 て C++で独自の可視化ツールを開発していく. 図 1 クラウド環境の構成 【研究計画】 (1) クラウド環境の構築と要求分析,および可視化方法の検討 (7-8 月) クラウド環境を構築・運用し,その過程で実際にクラウド提供側がどのような情報を必要とする のかを明確にする.そして,直感的に理解しやすい可視化の方法を検討する. (2) プロトタイプの実装(9-11 月) プロトタイプを作成し,デモができる段階まで実装を行う. (3) 研究調査(11 月) クラウドコンピューティングの学会に出席し,その時点での最新動向を得る.そして,クラウド 提供側では各レイヤのどんな情報を必要としているのか今後の応用の可能性についても探る. (4) システムの本実装および洗練(12-3 月) 研究会での発表や外部でのデモを行い,得られたコメントを基にシステムの完成度を高める. (5) スプリングセミナーにおけるデモ(3 月) 5 月に行われたオープンキャンパスを通じて,クラウドという言葉に興味を持つ学生が多く存在 することが分かった.少なくとも耳にしたことがあるという学生は多く来場しており,多くの質問 を受けた.本システムのデモでは,そのような来場者にクラウドの内部の仕組みについて直感的な イメージをつかんでもらうことを目的とする.また,会場では実際にシステムを触ってもらい,フ ァイルの作成や保存などの操作によってクラウド環境がどのような振舞いを見せるのかを体験し てもらう.さらに,4K ディスプレイでのデモを予定している. 【困難を克服できなかった場合の回避手段や代替案について】 本プロジェクトを行うに当たり,重要な課題となるのが各レイヤで取得したデータ同士の関連付 けである.データ同士を正確に結びつけることができなければ目的の達成は困難である.困難さは クラウド内に存在しているノード数が多いほど顕著となる.そのため,関連付けが困難な場合は, ノード数を減らすなど各レイヤでの多重化を抑えることで対応したい. [5]Jinesh Varia, Cloud Architectures 29 8.決算の要約 金額(千円) 設備備品費 支出予定月 299 8 月 品名・型名・数量/行先・目的・日数等 PowerEdge ・ R410 ・ CPU XeonE5506 2.13GHz, Memory 8GB,HDD 500G・2 台・ 実験環境構築 消耗品費 28 8 月 CPU・Corei7-930・1 個 15 8 月 PC ケース・PC-8B・1 台 23 8 月 電源・SS-850EM・1 個 24 8 月 マザーボード・P6X58D-E・1 個 25 8 月 メモリ・CHK2GX3-D3U1333・1 個 6 8月 内臓 3.5HDD・HDS721010CLA332・1 個 60 8 月 グラフィックカード・GD460-1GERX・2 個 11 8 月 HDMI-DVI 変換ケーブル・DH-HDDV20・ 4個 3 8月 合計 内臓ドライブ・GH24NS50Bl-B/K・1 個 494 9.プロジェクトの状況および自己評価の要約 我々はクラウドコンピューティング環境を管理する管理者を支援することを目的とし,ログ可 視化システム FU-JIN の開発を行った.従来の監視・可視化システムのように,単一のソフトウ ェアレイヤのログ情報に着目するのではなく,FU-JIN はクラウドコンピューティング環境全体 から収集したログの関連性を解析し,直感的に理解できるように可視化を行う.具体的にはクラ ウドコンピューティング環境全体の構成と命令の流れをリアルタイムに可視化して提供する. 本プロジェクトでは,クラウド環境全体を監視・可視化するためのアーキテクチャの1つを示 し,プロトタイプを実装してクラウドコンピューティング環境全体の構成と命令の流れを可視化 することの有用性を確かめた.設計に示した全ての機能を実現するには至らなかったが,本プロ ジェクトのコンセプトであるクラウド環境を可視化することの有用性を確認することができた. また,クラウド環境の監視・可視化システムに必要な要件を示し,可視化手法やログ収集手法の スケーラビリティの改善など実用に向けて今後解決しなければならない問題を研究課題として 挙げることができた. スプリングセミナーおよび学校見学会ではクラウドコンピューティングに興味のある方にデ モを見て頂いた.今回,本プロジェクトで開発したシステムが管理者用のシステムであるという こともあり,オペレーションの経験のない見学者の方には十分に興味を持っては頂けなかった. その一方で,OS や仮想マシンモニタなど低レイヤのソフトウェアに興味のある学生には十分に 興味を持って頂くことができ,意義ある議論を行うことができた.デモを通して得たアドバイス や反省点を活かし,FU-JIN システムのさらなる改良に取り組んでいきたい. 30 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 クラウドを暴く可視化システムの開発 プロジェクトリーダー 幾世 知範 1. 概要(背景と狙い) な試みが行われてきた[2][3].しかし,従来の監視・可 今日,さまざまな企業が独自のクラウドコンピューテ 視化システムはクラウド環境の ィング(以下,クラウドと呼ぶ)サービスの提供を行って いる.クラウドとはネットワークを介してアプリケーション やインフラを提供するサービスのモデルであり,サー ビス利用者は物理的な計算機環境を管理する必要が ない.さらに,アプリケーションがサービスとして提供さ れる場合は,OS などに関しても管理する必要が無く なる.また,サービスのスケーラビリティや可用性を高 めることができるため,多くの企業で導入が進められ ている. これらの利点は,分散処理技術および仮想化技術 によってもたらされている.仮想化技術によってリソー スを多重化することで可用性を高め,分散処理技術 図 1 CSA によるクラウドアーキテクチャの定義 でデータおよび処理を分散・集約することでサービス と対応するソフトウェア例 の ス ケ ー ラ ビ リ テ ィ を 高 め て い る . 図 1(a) は CSA(Cloud Security Alliance)によって定義されて いるクラウドのアーキテクチャモデルである[1]. 図1 のようにクラウドは多層構造を取り,レイヤ間で機能の 抽象化が行われているため,管理責任の切り分けが 実現されている. このような利点をもたらす一方で,仮想化技術と分 散処理技術はクラウド環境の構成を複雑にし,管理を 困難としている.特に障害が発生した際に,その原因 図 2 クラウドコンピューティング環境 を管理者が即座に特定することは現状では困難であ の構成と命令の流れ る.アプリケーションからハードウェアまでが 1 対 1 の 一部にのみ注目しており,ソフトウェアレイヤをまたい 関係にあった状況とは異なり,クラウドでは 1 つのアプ で発生するような障害に対応するには不十分である. リケーションが複数の OS および複数のサーバの上で また,多くの既存システムは波形などを用いた統計情 動作する.また,複数のアプリケーションが計算機資 報のみを提供しており,障害原因を見つけるためにど 源を共有するため,処理過程で関連が無いアプリケ の波形を見比べたらよいのか,提供情報の関連性を ーションやソフトウェアと依存関係を持つ.これらが原 管理者に示すことができないため,管理者の負担は 因となり,複数のソフトウェアレイヤをまたいで影響を 大きなままであった. 及ぼす可能性がある. そこで,本プロジェクトでは,クラウド環境から収集し 従来,クラウド環境を管理・運用するためのさまざま たログ情報から情報同士の関連性を直感的に把握で 31 図 3 FU-JIN の設計 きる可視化システム FU-JIN を提案する.FU-JIN は ならない対象とそのログ情報は膨大となり,管理者へ クラウド環境全体の構成と命令の流れ(図 2)をリアルタ の負担となってしまっている.この問題を解決するた イムに可視化する.動的に変化するクラウド環境の構 め,FU-JIN には,管理者が調査を行うべき対象およ 成を把握し,命令の流れを可視化することで,障害が び確認するべきログ情報を管理者に提供できることが 発生した際に管理者が確認するべき対象を視覚的に 要求される. 伝える.FU-JIN を利用することで,管理者が障害地 クラウド環境は今後の情報化社会を支える基盤で 点を特定する際の支援を行い,クラウド環境の管理・ あり,常に止まらないサービスであることが期待されて 運用を簡便化できると考えられる. いる.しかし,実際にはサービス停止に陥ってしまうよ うな障害の発生は起こりうる.また,サービスの停止に 2. FU-JIN システム は至らなくても,障害によりパフォーマンスが低下する 本節では,まずログ可視化システムに求めら 可能性がある.こういった場合,クラウド環境の提供者 れる要求定義を示し,次に FU-JIN システムの は即座に対処する必要あるため,FU-JIN システムに 設計と実装を述べる.その後,設計に対するプ はリアルタイムに情報を管理者に伝えることが要求さ ロジェクトの進捗と FU-JIN システムに関する れる. 評価を行う. 2.2. 2.1. 設計 FU-JIN は Monitoring Agent , Analyzer , 要求定義 クラウド環境を管理する上で FU-JIN に求められる Visualizer の 3 つから構成される(図 3).Monitoring 項目は以下の 2 つである. Agent ではクラウド環境を構成するソフトウェアコンポ 要求1. クラウド環境の管理者に対してログの関連 ーネントの監視とログの収集を行う.Analyzer では, 性を示し,障害地点の推定を支援する情報を提 Monitoring Agent が収集したログを解析し,クラウド 供できること 環境の構成とクラウド内の命令の抽出および関連性 解析を行う.その後,Visualizer が Web ブラウザを介 要求2. リアルタイムに監視・可視化できること クラウド環境は数千台規模のサーバを用いて,仮 してユーザに可視化した情報を提供する. 要求 1 を満たすため,FU-JIN はクラウド環境全体 想化技術と分散処理技術によって構築されており,複 数のソフトウェアやハードウェアが依存関係にある. の構成と命令の流れを可視化する.クラウド環境全体 そのため,管理者が障害発生時に調査しなければ の構成を可視化することで,依存関係にあるソフトウェ アおよびハードウェアを直感的にできる形で提供する. 32 表 1 各ソフトウェアから取得するログ 監視対象 アプリケーション 分散処理 フレームワーク GuestOS 仮想マシンモニタ (HostOS) 取得ログ ユーザのアクティビティ 監視対象プロセスの生成/消滅 Jo b および Task の生成/消滅 System call Hypercall GuestOS 情報 Network Packets ハードウェア情報 さらに,命令の流れを可視化することでクラウド上での 処理が正しく行われているのか,処理パターンおよび 命令の経路を明らかにする.また,要求 2 を満たすた め,ログ収集から可視化までを処理は数十秒以内に 行う. 今回は単一の管理者が管理するプライベートク ラウドを想定しており,ログは収集においてアク 図 4 構成と命令を記録する XML の形式 セス権の問題については考慮しないものとする. を確認した後処理をする(図 3(3)).図 3 の(4)から(6) 以下では,Monitoring Agent,Analyzer および にかけて,まずはログをパースし,クラウド環境の構成 Visualizer について基本設計を示す. や命令に関する情報を抽出する.処理し終わったロ グファイルは RDB に登録し,取得したクラウド環境の 2.2.1. Monitoring Agent 構成および命令情報は関連性解析した後,XMLDB 図 1 に示したようにクラウド環境は多層構造を に図 4 の形式で格納する.命令の関連性は XML の 取る.Monitoring Agent は各層を担うソフトウェ 形式で保存する.外枠の path がアプリケーションに ア(図 1(b))からログ情報を収集する. 関連する命令を表す.また,構成情報はオブジェクト クラウド環境全体の構成および命令の流れを可視 のシリアル番号と下位レイヤに存在するオブジェクトを 化するために取得するログ情報を表 1 に示す.さ 記録することで保持する. らに統計情報を HostOS および GuestOS から取 2.2.3. 得する. Visualizer Visualizer では Analyzer がログ解析によって得た Monitoring Agent の処理手順は以下の通りで クラウド環境の構成と命令の流れを Action Script を ある.GuestOS 上でログ収集対象ごとに監視を行 用いて可視化する.当初は Qt を用いて実装行う予定 いタイムスタンプとホスト名を記録して,HostOS であったが,リアルタイムでの監視を行う際,管理者が にログを送る(図 3(1)).次に,HostOS はログ整形 どこからでもクラウド環境を監視できる仕組みが必要と および仮想化による時刻ずれの修正を行った後, 考え Web ブラウザから監視ができる仕組みへ変更し Analyzer の Log 格納用ディレクトリに Log を配 た. 置する(図 3(2)).この時,ログに HostOS 自身の Visualizer は Archive-mode(図 3 7-a から 10)と Host 情報を付与する. 2.2.2. Runtime-mode( 図 3 7-b か ら 10) を 提 供 す る . Analyzer Archive-mode は 過 去 の ク ラ ウ ド 環 境 の 様 子 , Analyzer ではログの解析を行う.ある命令が発行 Runtime-mode ではリアルタイムの可視化を行う.ま された際に次に何の命令が発効されるかという前知識 た,Archive-mode ではログ情報を閲覧する機能をサ とログ同士の時間的な関連性に基づいてログの関連 ポートし,Runtime-mode ではリアルタイムな処理を 性解析を行う. 継続するためにログファイル情報のみをユーザに提 Log 格納用ディレクトリにログファイルが到着したこと 供する.また,統計情報をマウスオーバー等のアク 33 図 5 プロトタイプの構成 図 7 プロセスが落ちている状況の可視化 - 事前知識を用いたログの関連性解析 - HostOS 上の Monitoring Agent による 時刻補正 それ以外の機能のプロトタイプ実装は完了して おり,図 6 のようにリアルタイムにクラウド環境 を行うことを実現することができた. オブジェクト上をマウスオーバーすることでオ 図 6 プロトタイプ実装における可視化 ブジェクトに関連するログ情報および統計情報を ションに合わせて提供する. 2.3. 得ることができる.可視化した構成と命令情報を 実装 統計情報と組み合わせて利用することで, 各レイ 実装環境を図 5 に示す.仮想マシンモニタには ヤにおける統計情報同士の関連性が明らかとなり, Xen を利用し,その上で CentOS を GuestOS, 管理者の負担を軽減できると考えられる. HostOS として動作させた.また,分散処理フレ 2.5. ームワークとして Hadoop を採用し,Hadoop の 評価および考察 FU-JIN システムについて,ログ収集にかかる負荷率, プログラムをアプリケーションとして動作させる 障害地点特定の支援という 2 つの観点から評価と考 実験環境を構築した. 察を行う. 以下では,表1で示したログの取得方法を説明する. 2.5.1. ログ収集にかかる負荷率 Network packetsはtcpdumpによって取得し,監 今回のようにクラウド環境の命令をトレースするログ 視すべきプロセスやJobの生成・消滅はHadoopの 収集を行う場合,ログの量は非常に膨大となる.ログ ログから取得した.システムコールについては を取得する場合としない場合についてその負荷率の systemtapを利用して捕捉を行った.Hypercallに 違いを Hadoop のサンプルコード Teragen で 100 万 ついては独自の監視機能をHostOSからの管理機 個のデータ生成にかかる実行時間の違いで計測を行 能として実装し,HostOSからXen側の情報を取得 った.その結果,ログ収集を行う場合は 75 秒,行わな する仕組みとした.また,これらの情報をAnalyzer い場合は 51 秒で処理が完了した.ログ収集を行う場 まで届ける仕組みとしてscpおよびsyslog-ngを利 合 47%負荷が増加し,処理全体の 32%をログ収集が 用した. 占める結果となった. 2.4. プロジェクトの進捗 この負荷率は実運用を行う際には許容できる負荷 現段階で設計したシステムのうち残っている課 率ではないため,今後,ログ収集の実装方法の再検 題は以下の通りである. - 討およびフィルタの適用が必要になると考えられる. Archive-mode の実装 一方で,デバッグのように命令を細かな精度でトレー スする必要のある場合においてはフィルタして情報 34 行った(図 8).本プロジェクトの目的は管理者による障 害地点の特定を支援する可視化を行うことである.同 会議には,我々と同様にクラウド環境の障害に関する 研究を行っている研究者が参加しており,障害の原 因を特定することの重要さについて議論することがで 図 8 Cloudcom2010 での発表の様子 きた.また,本プロジェクトで取り組んでいる課題の重 量を落とすのではなく,フィルタのかかっていない情 要さを認識したうえで,可視化手法についてさらに工 報が必要な場合も考えられる.その場合には負荷率 夫をした方がいいなどの意見を頂いた. よりも多くのログ情報を取りこぼすことなく取得すること また,同会議では,クラウドに関する様々な領域の が必要となる.今後の開発を進めていく過程では,ス 研究発表を聴講し,現在の研究動向を探ることができ ケーラビリティテストの際に負荷率とログのロス率につ た.また,標準化団体の動向およびオープンソースの いて評価を進めていく必要があると言える. 動向など多方面からクラウドの現状と今後の展望に関 2.5.2. する情報を得ることができた. 障害地点特定の支援 図 7 に Hadoop プロセスの 1 つが停止してしま 3.2. スプリングセミナーおよびオープンキャンパス っている状態を可視化した結果を示す.長時間プ 3 月 11 日と 3 月 12 日にデモによる本プロジェクトの ロセスからシステムコールが発行されていないこ 成果発表を行った.本プロジェクトのデモでは,クラウ とと,OS 自体は命令を発行して動作していること ドの内部の動作を知って頂くことを目的として,我々の から,プロセスに以上が発生したことが認識する 開発した可視化システム FU-JIN を用いたデモを行っ ことができる.また,この際クラウド環境の構成 た. FU-JIN システムはクラウド環境の管理者を補助 が可視化されているため,統計情報等を確認する するためのものであるため,実際にオペレーション経 べき OS および仮想マシンモニタを直感的に把握 験の無い方々には十分に本システムの有効性を十分 することが可能である.また,統計情報が提供さ に理解して頂くことはできなかった.その一方で,実際 れるため HostOS や GuestOS にアクセスするこ にクラウドを企業内に導入している社会人の方々から となく状況を把握することが可能である. は実際に現場ではクラウドの扱いに困っており,本シ 以上のことから,クラウド環境全体の構成と命令の流 ステムの重要性を認識したうえで是非完成させて発表 れを可視化することは,管理者の負担を軽減する可 を行ってほしいというコメントを頂いた.また,先生方 視化方法の1つだと言える.しかし,今回の可視化方 からは多くのアドバイスを頂き,スケーラビリティなどの 法では数千台規模のサーバ群が並んだ際に全てを1 課題の指摘をして頂いた. つの画面に可視化できないという問題点がある.今後, より抽象度を挙げた可視化方法と組み合わせるなど, 今回のデモで頂いたアドバイスや指摘を整理し,今 後さらに FU-JIN システムの改良を図っていきたい. 1000 台規模 全てを収納できるような可視化手法につ いて検討を行っていく必要がある. 4.今後の展開 本プロジェクトでは,命令同士の関連性の解析を行 3. 成果 うことで一連の命令の中で欠けてしまっている部分を 本節では, Cloudcom2010 のポスターセッションに 障害地点として見つけ出す仕組みを採用していた.し て発表を行った成果とスプリングセミナーおよびオー かし,現状では命令の流れの機械的な解析は行えて プンキャンパスでのデモ発表の成果を報告する. おらず,今後 FU-JIN システムをより大規模な環境に 3.1. 適用するために,ログの関連性解析に取り組んでい Cloudcom2010 11 月 30 日から 12 月 3 日にかけて Cloudcom2010 かなければならない. に参加し,ポスターセッションでの発表および聴講を また,多くの方に指摘を受けた今回の可視化方法の 35 スケーラビリティについては今度,より抽象度の高い 今後,これまでの成果を研究会にて報告するととも オブジェクトマップを作製するなどの改善が必要であ に,今回示すことができた課題に取り組み,FU-JIN る.また,実際のオペレーションにおいて,1つの可視 システムの完成度を高めていきたい. 化方式だけでシステム全てを管理することは困難であ るため,状況に応じて使い分けることができるよう可視 参考文献 化方式を新たに提案していく必要がある. [1] Cloud Security Alliance. Security guidance for critical 仮想計算機を用いた環境では,時刻のずれ幅が大 areas of focus in cloud computing v2.1, December 2009. きくなるため,時刻合わせの際に問題が生じる.これ [2]A. Konwinski and M. Zaharia. Anomaly detection in the はロギング機能に大きく影響を与える.今回のプロトタ datacenter. Technical report, RAD lab, 2010. イプ実装では特に,時間的な関連性に基づいて可視 [3] M. Kutare, G. Eisenhauer, C. Wang, K. Schwan, V. 化を行った.そのため,時刻が数秒ずれてしまうとシス Talwar,and M.Wolf. Monalytics: online monitoring and テム全体が使い物にならなくなってしまう.これの問題 analytics for managing large scale data centers. In ICAC ’10: を発生させないためにも,時刻合わせを恒久的に行う Proceeding of the 7th international conference on Autonomic 仕組みが必要である.また,ログ収集にかかる負荷率 computing, pages 141–150. ACM, 2010. やログのロス率を軽減するログ収集アーキテクチャを 考えていく必要がある. 5.自己評価 クラウドコンピューティングに関する研究は世界中の 研究者が取り組んでいる分野であり,特に障害地点 の特定を補助するための管理者支援システムは実運 用の現場で求められている技術である.本プロジェク トでは,その要求に応える研究開発として,システムの アーキテクチャを示し,プロトタイプ実装を行いコンセ プトを実証することができた. 本プロジェクトの貢献は以下の 3 つである.まず 1 つ目は,クラウド環境を監視・可視化するシステムアー キテクチャの1つを示したこと.2 つ目は構成や命令を 可視化することの有用性をプロトタイプを実装すること によって示したこと.3 つ目は,クラウド環境を監視・可 視化していく上で今後解決しなければならない課題を 明らかにできたことである. 今後,上述の課題を解決 していくことで,FU-JIN を実運用システムに適用可 能なシステムにしていきたい. プロジェクトを遂行するにあたり,企画段階における 予算の見積や実際の物品の手配など自分たちの研 究に予算がつくという初めての経験を通して,自ら予 算を集める研究者としての初歩を学べたと思う.また, プロジェクト全体のタスク管理の難しさと管理していく ための方法を学ぶことができた. 36 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」研究提案書 1.プロジェクト名 ぶれない一途なレーザーポインタの開発 2.プロジェクトリーダー 所属講座 応用システム科学講座 学年 学生番号 M1 e-mail アドレス 氏名 1051106 水井 俊文 [email protected] 3.分担者(※他大学の学生も可.分担者無しも可) 所属講座 学年 学生番号 e-mail アドレス 氏名 応用システム科学講座 M1 1051028 片岡 壮太 [email protected] 応用システム科学講座 M1 1051033 川尻 圭介 [email protected] 応用システム科学講座 M1 1051038 喜多 功次 [email protected] 応用システム科学講座 M1 1051053 澤野 堅太 [email protected] 応用システム科学講座 M1 1051061 高橋 健太郎 [email protected] 応用システム科学講座 M1 1051089 広谷 拓也 [email protected] 応用システム科学講座 M1 1051102 松原 大和 [email protected] 応用システム科学講座 M1 1051115 森 美華 [email protected] 4.チューター 所属講座 応用システム科学講座 氏名 e-mail アドレス 平田健太郎 [email protected] 職名 准教授 5.必要経費 金額(千円) 設備備品費 消耗品費 旅費(調査目的も可) 支出予定月 100 10 月 品名・型名・数量/行先・目的・日数等 プロジェクタ 40 8 月 回路部品 10 8 月 赤外線カメラ×2 20 8 月 赤外線レーザー×2 90 8 月 ノート PC 20 9 月 レーザーポインタ関係部品 20 9 月 センサ関連 100 12 月 第 11 回 計測自動制御学会 SI 部門講演会 (1 泊 2 日×2) 140 11 月 第 11 回 計測自動制御学会 制御部門大会 (1 泊 2 日×2) 合計(上限 1,000 千円) 540 37 6.プロジェクトの背景と目的 近年,パワーポイントを用いたプレゼンテーションの機会が増加している.プロジェクタによ る発表といった場面において,指し棒やレーザーポインタなどは,説明を円滑に進めるために有 用なツールである.これらのツールはそれぞれ用途に合わせた特徴を持ち,レーザーポインタで は,指し棒の場合のようなスクリーンまでの距離による制約がないという利点があるが,一方で 手ぶれによる影響のため的確にポイントを示すことが困難であるという欠点を持つ.手ぶれは, 発表者の緊張などに依るところが大きく,プレゼンテーション発表においてポインタのぶれは聞 き手の注意力の低下や,発表者のマイナスイメージにつながる. 本プロジェクトでは,レーザーポインタにおける手ぶれの影響に注目し,手ぶれを外乱と見な したフィルタ処理によって,スクリーン上でぶれることのないレーザーポインタの開発を目指 す.提案する手法として,非可視光を発生するレーザーポインタによってスクリーン上に照射さ れた光をカメラによって撮影し,指し示された位置の検出を行う.次に手ぶれを補正するように フィルタリングしたポイントをパソコン上に出力することで,スクリーンに直接ポイントを示す といったシステムを考える.カメラによる位置検出は本講座で実績のあるビジュアルフィードバ ック技術を用いることで実現可能である.このシステムはレーザーポインタにおける安全につい ても有用性を持つ.レーザーポインタによる目への影響は広く知られており,日本工業規格(JIS) によれば主にプレゼンテーションに用いられるレーザー光は 0.25 秒以上直視すると目に悪影響 が出ると言われている.本システムはカメラによる位置検出にのみレーザー光を必要とするので 光の出力が低くても問題なく,人体への影響も軽減可能である. 次に本プロジェクトにおいて考えられる問題点としてカメラのサンプリングレートの遅さが 挙げられる.提案システムでは照射されたレーザーの移動に対して映像の取り込みが間に合わ ず,滑らかな操作ができない可能性が考えられる.そのような場合,解決案としてビジュアルフ ィードバックとモーションキャプチャを併用したハイブリッドな手法を考えている.具体的に は,加速度センサを手ぶれ補正ではなく,レーザーポインタの移動を検出するために利用し,レ ーザーの移動に対する追従性を向上させる方法である.この方法によってレーザーポインタの精 度が向上し,ユーザビリティの解消につながると考えられる.また,この手法では,カメラのサ ンプリング時にのみレーザー光が照射されていればよく,常にレーザー光を照射し続ける必要が ないため,更なる安全性の向上も期待される. 図 1. 提案品による効果例 38 7.目的到達までの研究計画 本プロジェクトは図 2 に示すような工程で行う. 図 2. 研究計画 工程1:赤外線カメラによって非可視光を撮影し,レーザーポインタで指された位置検出を行う. 工程2:WindowsAPI 等を用い,PC 画面上にポイントを描写できるプログラムを作成する. 工程3:手ぶれ補正を外乱と見なしたフィルタの構築を行う.具体的には,手ぶれによる外乱を 高周波成分,レーザーポインタの移動を低周波成分とし,高周波成分のみを除去するローパスフ ィルタを構築する. 工程4:手ぶれ補正を行った位置情報を入力としてシステム全体を構築する. 第一ステップにおいて赤外線カメラのサンプリングレートが低いことによって,レーザーポイン タの追従性が悪化し,ユーザビリティが低下することが可能性として考えられる.そこで解決案 として加速度センサを用いたレーザーポインタの移動検出を上記の位置検出と併用することを 考える.また,第二ステップにおいて,システムの拡張性を考え,文字等を描写するための軌跡 を描くプログラムについても並行して作成する. 図 3. 提案システム 39 決算の要約 金額(円) 消耗品費 旅費(調査目的も可) 合計 支出月(月) 品名•型名/行先•日数•人数 55,290 9 電子部品一式 3,980 8 赤外線カメラ 39,550 8 レーザポインタ 2,436 9 赤外線透過フィルタ 38,572 2 実験用ディスプレイ×2 55,429 2 表示用プロジェクタ 4,667 2 統合用ケース 84,735 2 計測•制御用 PC(hp G62-459TU) 81,100 11 SICE セミナー(東京), 2 日間, 2 人 65,640 11 ISCIE 国際学会(岡山), 2 日間, 3 人 61,800 12 SI2010(仙台), 3 日間, 1 人 493,199 プロジェクトの状況および自己評価の要約 まず,第1ステップとして,購入した赤外線レーザーポインタの光点を赤外線カメラで取得で きるかの確認を行った.ここでの問題点は 2 点あった.1点目として,赤外線カメラは可視光の 情報も取得しており,赤外の情報のみを取得できていないことが分かった.これに対応する為に, 赤外線透過フィルタを用いた.2点目としては,赤外線レーザーポインタは広角に光が広がって いたため,レーザーポインタとしての役割を果たしていなかった.これに対しては,可視光を用 いたレーザーポインタではコメリートレンズと呼ばれるレンズで光を集約していることが分か ったので,安価なレーザーポインタのコメリートレンズを移植することによって対応した.第2 ステップとして,取得したレーザーの情報を基に画面上に点を描画することを行った.これには, Windows API を用いることでマウスカーソルを操作し,レーザーポインタで照射された点を示す こととした.これと並行して,モーションセンサ(加速度センサ(3 軸)+ジャイロセンサ(2 軸)) による操作者の手の動きを読み取る為の回路作成を行った.これには,まず wii リモコンを参考 としてそれぞれのセンサがどのように利用されているかの調査を行い,回路の作成を行った.第 3ステップとして第2ステップで行ったそれぞれの情報をプログラム上で統合することを行っ た.第4ステップとして赤外線レーザーポインタと作成した基板の物理的な統合をケースを作成 することで行った。 今後の課題としては,モーションセンサの更なる有効活用が考えられる. 40 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 ぶれない一途なレーザーポインタの開発 プロジェクトリーダ 水井 プロジェクトメンバ 片岡,川尻,喜多,澤野,高橋,広谷,松原,森 チュータ 平田 1. 概要(背景と狙い) 提案する手法として,非可視光を発生するレ 近年,パワーポイントを用いたプレゼンテー ーザーポインタによってスクリーン上に照射さ ションの機会が増加している.プロジェクタに れた光をカメラによって撮影し,指し示された よる発表といった場面において,指し棒やレー 位置の検出を行う.次に手ぶれを補正するよう ザーポインタなどは,説明を円滑に進めるため にフィルタリングしたポイントをパソコン上に に有用なツールである.これらのツールはそれ 出力することで,スクリーンに直接ポイントを ぞれ用途に合わせた特徴を持ち,レーザーポイ 示すといったシステムを考えた.カメラによる ンタでは,指し棒の場合のようなスクリーンま 位置検出は本講座で実績のあるビジュアルフィ での距離による制約がないという利点があるが, ードバック技術を用いることで実現可能である. 一方で手ぶれによる影響のため的確にポイント このシステムはレーザーポインタにおける安全 を示すことが困難であるという欠点を持つ.手 についても有用性を持つ.レーザーポインタに ぶれは,発表者の緊張などに依るところが大き よる目への影響は広く知られており,日本工業 く,プレゼンテーション発表においてポインタ 規格(JIS)によれば主にプレゼンテーションに のぶれは聞き手の注意力の低下や,発表者のマ 用いられるレーザー光は 0.25 秒以上直視する イナスイメージにつながる. と目に悪影響が出ると言われている.本システ 本プロジェクトでは,レーザーポインタにお ムはカメラによる位置検出にのみレーザー光を ける手ぶれの影響に注目し,手ぶれを外乱と見 必要とするので光の出力が低くても問題なく, なしたフィルタ処理によって,スクリーン上で 人体への影響も軽減可能である. ぶれることのないレーザーポインタの開発を目 指した. また,加速度センサを用いたモーションキャ プチャを付加機能として加えることで,スライ ドショーのページ送りなどが可能なようにシス テムを構成した.図 2 に本プロジェクトのシス テム構成図を示す. 図 1. 提案品による効果例 図 2. システム構成図 41 2. プロジェクトの進捗 2.2 画像表示プログラム 本章ではぶれないレーザーポインタを構成す 2.2.1 フィルタ る,画像処理プログラム,画像表示プログラム, ぶれをとるためのフィルタとして,今回移動 モーションキャプチャ,ハードについて述べる. 平均フィルタを採用した. X 軸,Y 軸方向につ いての過去6点の座標データの平均を現在の座 2.1 画像処理プログラム 標として,ポイントを描画する際の座標とした. 図 6 は,一点を指し続けようとしたときの,移 本プロジェクトでは,レーザーポインタによ ってスクリーンに照射された光の位置を検出す 動平均フィルタの効果を示している. るために Open CV を用いた画像処理を行って いる.また,赤外線レーザーポインタによる非 可視光を撮影するため, 図 3 に示す赤外線 WEB カメラ DC-NCR13U を用いている.さらに, WEB カメラによって撮影されたスクリーンの 形状は射影変換によって図 4 のように PC 画面 サイズに正規化している. 図 6 左:実測値,右:移動平均フィルタ処理後 カメラのフレームレイトが 33msec の製品を 使用しているため,過去6点を取得するために 約 0.2sec かかってしまうことから,素早く移動 させたいときに遅れを感じるという問題があっ 図 3. DC-NCR13U 図 4. 正規化 た.これに対しては,一つ前の座標からの移動 赤外線 WEB カメラでは,本来人の目に見え 量が大きい場合は,フィルタをかけないことで ない非可視光を撮影することができるが,可視 遅れに対処している.フィルタの別案として, 光も同時に写ってしまうため,そのままでは, ローパスフィルタの導入も検討したが,移動平 画像処理による位置検出が正確に行えないとい 均フィルタに比べ即応性が悪い,フィルタのオ う問題点がある.そこで本プロジェクトでは, ン,オフの切り替えができないことから,採用 図 5 に示す可視光を除去するフィルタをカメラ しなかった. レンズに取り付けることで,非可視光のみ撮影 可能なカメラを構成し,正確な位置検出を行っ 2.2.2 ポイントの表示 表示のプログラムは windowsAPI を用いて作 ている. 成した.今回は,マウスポインタを丸い点にプ ログラム上で変更し,座標を制御することでポ インタの描画を実現した.プログラムが終了す ると,マウスポインタは元のアイコンに戻すよ うにしてあり,座標の制御権もマウスに戻す. 図 5. 可視光除去フィルタ マウスポインタのアイコンは,任意の画像で作 成することができ,今回は実験的に「せんとく ん」をポインタのアイコンとした. 42 さらに,表示プログラムの機能として,お絵 2.4 ハード 描き機能を付加させた.デバイスの裏につけた 2.4.1 回路 ボタンを押している間,ポインタの軌跡を残す 回路は,中心的役割をする PIC マイコン周辺 ようにプログラムすることで,スクリーン上に 回路,PC・PIC 間の Bluetooth 通信回路,加速 絵を描く感覚で使うことができる.具体的には, 度,ジャイロセンサに関する回路,それらに用 プレゼンテーションを行っているスライドのウ いる電源回路で構成される. インドウハンドルを取得し,そのウインドウ上 まず,回路の中心となるマイコンを選定した. に任意の座標間に線を引くようにプログラムし マイコンの種類としては,使用実績があり,開 た.任意の座標にはポインタを表示する座標を 発環境の構築が比較的容易であることから PIC 割り当ててあり,ループさせることで線をつな マイコンを用いた.センサ情報を A/D 変換する げている. ために,アナログポートが 5 個以上,さらに, スイッチとその ON/OFF を確認するための LED 用 I/O ピンを 2 個ずつ,合計 9 個以上の I/O ピンを持ち,そして,センサ情報を PC に送 るので USART 通信機能を持つ PIC16F873A を 選んだ.そのピン配置を図 8 に示す. 図 7 お絵描き機能のイメージ 2.3 モーションキャプチャ 図 8 PIC16F873A 本節では追加機能として新たに加えたモーシ ョンキャプチャについて説明する.この機能に 次に, PIC,セ ンサ,Bluetooth の電 源を よって,発表者の手の動きだけでスライドのペ DC-DC コンバータを用いて生成した.DC-DC ージを送ることができる.ぶれないレーザーポ コンバータを 2 個用いることで 1 つの電源(乾 インタ本体に取り付けた加速度センサの情報を 電池 2 本)から 3.3[V],5.0[V]の安定な電源を Bluetooth によって PC に送り,加速度が一定 生成した.また,AD 変換の参照電圧も 5.0[V] 値を超えるとページを送るようにすることでこ から 3.3[V]に変更して,AD 変換の精度を向上 の機能は実現されている.今回はページ送りの させた. みの機能を追加したが,ジャイロセンサなどと 併用することで,さらに有用な機能を追加でき ると考えられる. 43 3.セミナー・学会報告 2.4.2 外装 実際に使用者が操作するレーザーポインタと, 3.1 SICE セミナー ‐現代制御理論入門‐ 基板との統合を行ったケースの作成において考 (1) 日時: 2010 年 11 月 18 日(木) - 19 日(金) 慮した点を述べる.購入した赤外線レーザーポ (2) 会場: 東京工業大学 大岡山キャンパス インタは使用目的として赤外線照射機としての (3) 主催: SICE ものであり,広範囲に赤外線を照射するもので (4) 参加者: 喜多,森 あった.これではレーザーポインタとしての役 (5) 内容: 割を果たすことができない.これに対応する為 ・ モデリングと状態方程式 に,一般的なレーザーポインタに用いられてい ・ 座標変換と可制御性・可観測性 るコメリートレンズを使用した.このレンズを ・ システムの応答と安定性 用いることで分散している光を一点に集約する ・ 状態フィードバック ことができる.一般的なレーザーポインタもこ ・ オブサーバー れを用いることで LED からの光を集約させ, ・ デジタルコントローラの実装 レーザーポインタとして使用している. ・ 非線形システムの線形化 次に,レーザーポインタと作成した基板の物理 (6) 所感: 的な統合について述べる.ここで考慮したのは 本セミナーは 1988 年以来幅広い層に支持され できる限りコンパクトにすることと,電池交換 ている「定番セミナー」の 1 つで,現代制御理 などのメンテナンス性の良さである.また,蝶 論のエッセンスを身につける事を目的としてい 番などを用いると見た目に良くないので,その る.直接的に本プロジェクトに手法で参考とな 点も考慮した.それらを考慮して作成した図を るものは無かったが,製品開発に必要な基礎概 以下に示す. 念,直観的な制御系設計の考え方がプロジェク トの遂行に役に立つと考え参加した. セミナーでは豊富な例題に基づく丁寧な講義に 加え,セミナー用に開発したシミュレーション プログラムを用いて車両系の極配置や最適制御 のパラメータチューニングをパソコン上で行う 演習や,倒立振子系の実験 装置を用いたデモン ストレーションにより最適制御の実際を体験す ることを通して,現代制御理論の基礎が理解で きるようになっており非常に勉強になった.ま た,モデリングから実際の制御系設計,実装を 図 9 完成図 カバーし,非常にわかりやすく進められた. 3.2 SSS'10 「第 42 回ストカスティックシステ ムシンポジウム」 (1)日時:平成 22 年 11 月 26 日,27 日 (2)会場:岡山理科大学 40 周年記念館(岡山県 岡山市北区理大町 1-1) 44 (3)主催:システム制御情報学会 3. 3. 計測自動制御学会 SI2010 (4)参加者:片岡、高橋、広谷 (1) 日時:平成 22 年 12 月 23 日~25 日 (5)内容: (2) 会場:東北大学 川内キャンパス ・システム同定とパラメータ推定 (3) 主催:計測自動制御学会 ・時系列解析とスペクトラル解析 (4) 参加者:水井 ・信号検出と不規則信号処理 (5) 内容: ・確率最適化手法・進化的手法 ・ モーションキャプチャの研究 ・数理ファイナンス ・ 制御理論の研究 ・故障の検出と診断 ・ 画像処理に関する研究 ・ネットワークの制御 ・ バイクロボットに関する研究 (6)所感: ・ はやぶさ講演 (6)所感: 本プロジェクトにおいては,赤外線ポインタ の座標情報から,ぶれを除去する.X 軸,Y 軸 本プロジェクトは画像処理・ビジュアルフィ それぞれについての座標の信号から,高周波の ードバック・モーションキャプチャに重点を置 信号をカットすることで,ぶれを除去できるの き取り組んできた.そこで,これらに関する研 ではと考えたため,信号処理関連の本学会へ参 究や,現在の研究動向を多角的に調査するため 加した.また,学会のメインテーマが確率シス にシステムインテグレーション部門の学会へ参 テムに関する研究発表であり,ぶれの発生も確 加した. 率的に生じると考えられるため,適当と考えた. 会議中には,画像処理を用いた物体の検出や 発表の中に,確率システムにおいて外乱を推 ロボットの制御,またモーションキャプチャに 定して,それを打ち消すように入力を与える手 関する考え方などを知ることができた.特に加 法に関する発表があり,ぶれを外乱と考えてそ 速度センサとジャイロセンサを用いたバイクロ れを除去するようにポインタの座標を制御する ボットの研究では,センサ情報をリアルタイム という考えを得るきっかけとなった.最終的に で処理して目標を達成しており,リアルタイム は別の手法でぶれの除去を行ったが,異なる視 処理が要求される本プロジェクトにおいても大 点から考えることができた点で,本学会の参加 いに役立つ内容だったと考える.さらに, 「はや は有意義だったと考える.スペクトラル解析に ぶさ」の開発の指揮を取られた吉川先生の講演 関する研究発表では,信号をスペクトルに分け は,制御に関する最先端の技術や直面した課題 て解析し,特徴量を抽出する手法に関する話が への取り組み方,解決策などを直に聞くことが 聞けた.この内容から,ローパスフィルタ作成 でき感銘を受けた. のための情報を得ることもできた. 学会全体を通しては,現在の研究動向や会場 また,参加者の個人的な面でも,学会発表を の雰囲気を知るだけでなく,積極的に質問をす 控えた参加者が,発表の雰囲気をつかめたこと ることができ,他大学の学生との交流も深まっ や,個人の研究に活かすことができそうな理論 たと感じたので非常に有意義なものだった. の紹介があったため,本学会に参加した価値は 大きいと考える. 45 4.成果 システムに関する専門的な質問などを受けるこ 2.4.2 節の図 9 に示すような完成品を作成す とができ,多くの人に興味を持ってもらえたこ ることができた.また機能についても,提案書 とは大きな成果であったと考える.しかし,カ の段階で想定していた仕様をほぼ満たす内容と メラの性能上,早すぎる動きには対応できず, なっている. その点が不十分であるという, システム性能に スプリングセミナーおよびオープンキャン 関する貴重な意見も頂戴した.. CICP 全体としては,テーマの決定からプロ パスでは得票数が一位とわずか一票差での2位 という結果であった. ジェクト発表までの全工程をほぼ学生のみで進 めるという貴重な体験をすることができたため, 5.今後の展開 非常に意義のある経験ができたと考える. 今後の展開としては,モーションキャプチャ を利用した更なる機能の追加などが考えられる. 謝辞 また,現段階では,カメラの性能などにより, このような貴重な機会を与えて頂いた CICP 推進 スクリーンからカメラまでの距離がかなり限定 委員会はじめ関係者の皆様に深く感謝いたします. されてしまうため,早すぎる動きに対応できな また,本プロジェクトを進める上で,有益なご助言を いなどの問題点があげられる.このような問題 賜りました平田准教授に深く御礼申し上げます.そ は加速度センサおよびジャイロセンサの情報を して,外装を作成する際に多大な助力を下さった 利用することで解決できると考えている,具体 高取電気工作所の辰巳さんに深く感謝いたします. 的には,素早い動作の時には画像情報ではなく, また,CICP の会計や発注の手続きをしてくださっ センサ情報を用いるといったハイブリッドな手 た秘書の林さん,教務職員の足立さん,そしてプロ 法などが挙げられる.また,ユーザビリティを ジェクトに協力してくれた応用システム科学講座の 追求するならば,着脱式の可視光センサは理想 皆様に感謝いたします. 的とは言えないため,画像処理の視点からも改 善の余地はあると考えられる. 参考文献 6.自己評価 [1] 佐藤幸男,信号処理入門,オーム出社版局, 1987 年 前章でも述べたように,プロジェクト立ち上 げ時の構想がほぼ実現できたため,満足のいく [2] 後関哲哉,電子工作のための PIC16F 活用 成果は上げたと考える.しかし,プロジェクト ガイドブック,技術評論社,2004 年 を進めるうえで,新たに浮かび上がった課題や [3] 柴田望洋,明解 C 言語, Softbank Creative, 改善案がすべて解決できたわけではないので, 2004 年 まだまだ完璧な内容ではないと言える. [4] 粂井 康孝,猫でもわかる Windows プログ スプリングセミナーおよびオープンキャンパ ラミング 第 3 版,Softbank Creative,2008 年 スでの参加者の評価も上々であり,得票数で第 [5] 川又 雅征,MATLAB で学ぶ信号号処理の 二位という結果であった.基本的な質問から, 基礎 46 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」研究提案要旨 1.プロジェクト名 Project Bayanihan: A Web 2.0 Front-end for Flood Mapping Systems 2.プロジェクトリーダー 所属講座 学年 学生番号 情報基礎学 D1 961212 所属講座 学年 学生番号 生命機能計測学 M1 1051138 ロボティクス M1 1051137 ソフトウェア工学 M1 1051140 インタラクティブ メディア設計学 M1 1051139 氏名 e-mail アドレス MEJIA Ramon Francisco [email protected] 氏名 e-mail アドレス 3.分担者 DY Mary-Clare Clarin MAGTANONG Emarc Perri Dizon YONGPISANPOP, Papon [email protected] YU, Juan Carlos [email protected] [email protected] [email protected] 4.チューター 所属講座 職名 氏名 情報基礎学 准教授 楫 勇一 5.必要経費 金額(千円) 支出予定月 品名・型名・数量/行先・目的・日数等 300 100 150 7月 7月 7月 70 80 7月 7月 Development Workstation (x3) Web/Database Server (x1) Server/Presentation Monitor (x2) Mobile Clients Tablet computer (x1) Smartphone (x1) 35 7月 20 7月 3G SMS Modem (x1) 25 20 7月 7月 iPhone Developer Program (x2) 旅費(調査目的も可) TBD TBD Presentation to International Conference on Flood Management 合計 800 設備備品費 消耗品費 Entry-level phone (x1) Reference Books (iOS, Java ME) 47 6.プロジェクトの背景と目的 According to the EM-DAT International Disaster Database, the Philippines is hit by an average of 7 tropical cyclones annually and causes severe flooding across the country. Historical records show that major floods result in an average of ¥265 million worth of damages, 13 deaths and hundreds of thousands affected every storm. As a result, the country invests a lot of resources in its Flood Mapping Systems. These systems show visual information of flood occurrences in a geographical map, leading to damage mitigation and better emergency aid. However, a major obstacle to programs in developing countries is gathering ample flood data such as water depth at a given location. Access to more data can lead to better flood risk management and prediction. The purpose of Project Bayanihan is to provide a front-end for Flood Mapping Systems using pervasive Web 2.0 technologies. From the spirit of the word bayanihan (a Filipino word for cooperation), this front-end will allow citizens to report flood data through easily accessible channels such as the web and SMS channels, through multiple mobile platforms. By enabling as many citizens as possible to contribute data easily, the quality of data for flood mapping systems will improve and in the long-term save lives. Figure 1. System Diagram of Project Bayanihan Figure 1 depicts the scope of this project. It covers two subsystems: the User Portal and the Flood Data Warehouse. The User Portal subsystem consists of a web server, an SMS server, and multiple mobile devices: a tablet computer, a smartphone, and a basic mobile phone. Applications are created for each device, taking advantage of the features of each platform (rich UI, GPS, etc.). The applications also report flood data using text/SMS (for all devices) and on Geographic Information Systems such as Google Maps (for supported devices). 48 The Flood Data Warehouse subsystem processes information obtained and made available to the User Portal. It contains flood data about conditions related to the current storm, and historical flood data optimized for analysis queries. Flood data analysis algorithms mine the data to produce flood mapping and prediction information. (Note that the scope of the project will only cover basic analysis, although data can be made available to more mature systems in the future.) With these two subsystems, an adequate simulation will be performed to show the impact of the system. 7.目的到達までの研究計画 (6 – 7, max pages = 2) Critical to the success of the project is to the quick development of the system to allow more time for simulations to be run. To build the system in a faster yet reliable manner, the team will utilize a Rapid Application Development methodology. However, it is important that a general architecture be designed first, and a reliable test plan and strategy be laid out. In this way, development efforts are guided, components are well-tested, and resources can be utilized properly. 49 8.決算の要約 金額(千円) 設備備品費 支出予定月 品名・型名・数量/行先・目的・日数等 89 9月 Gateway DX4840-N54F/GL 95 9月 Mac mini Snow Leopard Server 99 9月 Dell Alienware m11x 99 11 月 Dell XPS 14 65 9月 Display: LG Flatron M3703C-BA 40 9月 Display: Acer G245Hbmid (x2) 28 11 月 Display: IO Data 27” Monitor Mobile Clients Tablet computer (iPad x2) 117 10 月 消耗品費 5 10 153 1月 10 月 Reference Books (R in a Nutshell) iPhone Developer Program Others (accessories, display adaptors etc) 旅費(調査目的も可) N/A N/A Osaka University Global COE Program Young Researchers' 2nd International Workshop on Ambient Information Platform 合計 800 9.プロジェクトの状況および自己評価の要約 In Project Bayanihan, we were able to integrate a basic mobile phone (Nokia N95), a smart phone (iPhone 3GS), a tablet computer (iPad) and a personal computer to send and receive information from a web server through SMS, email, and other easily accessible channels. The system was implemented using an open source software called Ushahidi, a tool which could easily crowdsource information using multiple channels. This tool was used in both subsystems: for the User Portal: the web server was interfaced with the mobile devices through available APIs, so that we only needed to design and create the SMS format. With user friendly interfaces, people could send flood related reports using their mobile devices and personal computers; For the Flood Data Warehouse, we were able to collect and organize the reports sent to the server. To filter the information received, the web administration first had to approve of the report, and second, trusted sources were chosen, and they could verify if the data received were true. The verified data would then be passed to the flood mapping system to create a flood map. Simulated data were used to see if the flood mapping system was functional. To improve the system, the SwiftRiver platform could be incorporated into the data filtering process. Also, collecting more data (reports, existing data for flood maps) could test if the system could withstand a large amount of data flowing in and out, since our long term goal is to launch the Bayanihan project in an emergency situation where fast information dissemination under reduced communication network availability is critical. 50 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 Project Bayanihan: A Web 2.0 Front-end for Flood Mapping Systems プロジェクトリーダ Ramon Francisco P. Mejia 1.概要(背景と狙い) cooperation), this communication model allows According to the EM-DAT International Disaster citizens to report flood level data through easily Database, the Philippines is hit by an average of 7 accessible channels such as the web and SMS tropical cyclones annually and cause severe channels, through multiple mobile platforms. This flooding across the country. Historical records will result in an increased quantity of flood level show that major floods result in an average of data reported in real-time. ¥265 million worth of damages, 13 deaths and hundreds of thousands affected every storm. As a 2.プロジェクトの進捗 result, the country invests a lot of resources in Figure 1 depicts the scope of this project. It covers Early Flood Warning systems and flood mapping two subsystems: the User Portal and the Flood systems. Existing EFW systems are usually Data Warehouse. managed by town officials and volunteers who The User Portal subsystem consists of a Web check the flood levels at certain locations in their server, an SMS server, and multiple mobile town, like the river and known flood basin, and devices: laptops, tablet computers, smartphones, alert the people through megaphones or sirens. and other mobile phones. By adding many types of Flood bulletins are also placed in municipal halls or devices to the User Portal, we enable as many other mapping citizens as possible to contribute data to the systems are also developed to show visual system. To achieve such a scalable system, an information of flood occurrences in a geographical interface map. These flood counter- measures improved the communications with the server. accessible locations. Flood is built in order to standardize damage mitigation efforts and emergency aid given to masses. However, a major obstacle to programs in developing countries, especially for the flood mapping systems, is gathering ample flood data such as water depth at a given location. Slow information dissemination also leads to confusion and panic among the people thereby causing more harm and damages during emergency situations. Therefore, access to faster and more data is necessary to manage food risk Figure 2. System Diagram of Project Bayanihan efforts and prediction. The purpose of Project Bayanihan is to provide a Reporting and querying applications are created front-end for Flood Mapping Systems using for each device, taking advantage of the features pervasive Web 2.0 technologies. From the spirit of of each platform (rich UI, GPS, etc.). Applications the word bayanihan (a Filipino word for on Internet-enabled devices connect to the web 51 server via 3G. On the other hand, applications on to integrate mobile devices such as a smart phone other an (Apple iPhone) and a tablet computer (Apple iPad) inexpensive service which has a wide coverage using Apple SDK, and a basic mobile phone area in the Philippines. To facilitate connection, ((Nokia N95) using Nokia Symbian, to the the application sends a formatted text message to Bayanihan website. The flood mapping system the SIM number in the SMS Modem connected to was also incorporated in the website using the the server. The server then reads this message computing language, R. The details on usage of and parses its contents to produce the appropriate each device will be discussed in the following: query insertion into the data 3.1. GSM mobile phone (Nokia N95) should 1. devices or These connect data for applications because they must through be enable SMS, user-friendly citizens and Download the Bayanihan Application in the GSM mobile phone. (Figure 3.a) emergency teams to quickly and accurately report 2. flood data. Moreover, they must be able to issue The screen would show the address window. (Figure 3.b) queries such as flood levels by location, or flood water movement. To do this, applications are created using iOS and Java ME platforms, and utilize other graphical components such as Geographic Information Systems. Figure 2 shows some tentative user interface designs. c a b Figure 3. Screenshots of Bayanihan Project in used in a GSM phone (for instructions 1 to 3) 3. Input the address of the location. (Figure 3.c) 4. Select report details: a. Choose the News category. You can scroll down to check other incidents. (Figure 4.a) b. In the Events category, when you click Flood, the screen will show you the different flood Figure 2. System Device User Interface depth estimates. Scroll down then click the appropriate flood height in your location. (Fig. The Flood Data Warehouse subsystem stores and 4.b) processes flood level data. The flood levels c. obtained from filtered reports will be used for the In the Help category: scroll down to check the appropriate assistance needed. (Figure 4.c) flood mapping system. Using this in conjunction with the features inherent in the Bayanihan website, emergency teams can make informed decisions in their effort to mitigate the risks associated with floods. 3.成果 a b c Figure 4. Screenshots of project Bayanihan application used in a basic mobile phones (for instruction 4) We have successfully implemented the Bayanihan project using the Ushahidi platform; we were able 52 b. Tap the incident for more information. (Figure 7.b) a 5. Optional: Add a message to give more details Figure 7. Screenshots of Bayanihan Project in used in iPhone and iPad (for instructions 2a to 3) about your situation. (Figure 5.a) 6. c b To send the report via SMS: Click Options, then 3. To send a report, tap the Report icon and fill in the select, Send Report. (Figure 5.b and 5.c) necessary information. (Figure 7.c) 7. Wait for the confirmation reply of the server. a. 8. You can choose which one to fill out first by you can choose the applicable incident under selecting through the tabs. Fill out the Address, those three categories. When you are finished, Report and Flood to successfully send your report. tap the Done button seen at the upper right Choose an Event, a Type and a Flood depth, corner of the screen. (Figure 8.a) b. Fill out the Description to make the report more informative. When finished, tap Done. (Figure 8.b) a b c Figure 5. Screenshots of Bayanihan Project in used in a GSM phone (for instructions 5 to 6) 3.2. Apple iPhone and iPad 1. Start the Bayanihan project application on the a iPhone or iPad. (Figure 6.a) b Figure 8. Screenshots of Bayanihan Project in used in iPhone and iPad (from instructions 3a to 3b) c. Input in your specific location because even if the iPhone and iPad have GPS capabilities, they do not pinpoint your exact whereabouts. d. a b To send the report to the Bayanihan web server, tap Done. (Figure 9.a) c e. Figure 6. Screenshots of Bayanihan Project in used in iPhone and iPad (for instructions 1 to 2a) You can also include optional photos and news links to make your report more credible. 2. You can filter the kinds of reports that you want to (This is especially needed when the user is know. For example. tap the Filter icon, and choose sending a report for the first time. These added which category that you need. (Figure 6.b and 6.c) features a. authentic.) Tap the report that you are interested in. (Figure 7.a) 4. 53 can make your report more You will see in the Reports page the information that you sent together with the other verified and options such as: a. Report Title (Figure 11.a) unverified reports. (Figure 9.b) b. Description (Figure 11.b) c. Find a location near you, and Find location (Figure 11.b) d. Categories (Figure 11.c) e. Refine Location Name (Figure 11.d) a f. b Click Submit (Figure 11.d) g. Optional Information Figure 9. Screenshots of Bayanihan Project in used in iPhone and iPad (from instructions 3c to 3d) 3.3. Personal computer Through email: 1. Send to [email protected]. 2. Explain your situation. Remember to include your a location, what kind of incident is happening in your b location, and other important information about your situation. d c Figure 11. Sending a report using the Bayanihan project website. (For instructions 1 to 3) Figure 10. Sending a report through email to the Bayanihan project 4. A message confirming you submission will appear after sending your report. (Figure 12) Through the website: The system that we created is web based; there are two sides for the website: one is for the regular users where they can send and check the reports that had been verified and see the flood map. They can also get alerts for Figure 12. Confirmation message for report senders in the Bayanihan website different locations. And the other side is for the administrators (usually composed of the trusted sources) where they can check the reports that are 3.4. Flood Map pending for verification, and they can customize the After the reports are filtered, the information will be sent different events or type, and also add administrators. To to the flood mapping system. Areas in red represent send a report through the website: places with high flood depths, while areas within the 1. Type in http://www.bayanihan.dyndns.org/ in the blue show the places with lower flood heights. web browser, to send a report. Emergency task forces can use the flood mapping Click Submit a Report. system to find people who are in need; they can choose 2. 3. Write the necessary information in the following the particular event that they need to address. For 54 example, Rescuers can click on Rescue demonstration. or For the crowdsourcing of Injury/Casualty and see people who need to be saved, information/reports: easier User Interfaces should or who are hurt, respectively; Relief goods operatives be developed, since our initial interfaces, although can click on Food/Supplies to see the places where easy to understand, still took quite some time to fill people lack food, among others. out. Also, to increase report/data collection, other accessible channels can be incorporated to the system such as Twitter, Facebook, and other relevant social networks, as well as creating the Bayanihan project application to be compatible with other smart phones and tablet computers. Moreover, stress and load testing for our servers and related communication networks must be benchmarked against expected loads and network availability similar to conditions experienced during heavy rains and flooding. Figure 13. Simulated Floop Map for project Bayanihan For the mobile devices used for data gathering: 4.今後の展開 (future development) we can include more features for the GSM phone, The prototype system we presented last Spring such being able to send SMS through the GSM Seminar and Open Campus was operational, with modem, and being capable of sending flood depth over 50 users sent in reports. However, we alerts automatically to users. For the iPhone/iPad, experienced problems such as slow update for the although it is possible to open the Bayanihan reports and flood map, especially during the Open project website in the search engines, developing Campus. It may be because we were only the Bayanihan application to be more efficient will connected to the internet through a public still give a faster service. For the task forces who Wireless Frequency connection, and our servers are carrying the iPads, being able to update the only had limited capabilities because we only events in the map will ease the distribution of used laptop computers. These problems can be workload. For example, when the rescue effort in addressed by using a faster and more reliable a particular place is successful, the rescuers can internet connection (LAN connection), and a update the flood map so that other rescue teams computer with good specifications. Data security can go to other places where people need their features must of course be also incorporated to assistance. This capability can also help the task ensure reliable information. When these are force managers to spread out each team, while accomplished, we can launch the application to a the teams can also monitor each other’s positions. bigger audience to determine if the system can The Data Filtering process is the part which we withstand more traffic. have Because our system will be used during times of SwiftRiver platform can dramatically improve our emergencies, fast service and ease in usability system since it has APIs that can filter data are the key ideas that our system must improve on. through machine based algorithms, and not just Several developments for the three processes rely on human verification. This means automatic were emphasized during the Bayanihan project filtering of data and source veracity (user 55 to greatly improve: incorporating the credibility) updating can be incorporated in our tools we can use to create our system, and finally system. produce a working prototype that our audience Finally, creating a real-time flood map will be appreciated during the project demonstration. crucial for future use: the flood map must be During the workshop that we attended last developed in such a way that it will change February, we also received numerous advices for according to the latest reports that are sent by our system, most notably was that our system can users, either through more efficient statistical also be used to see which places have limited or models or powerful image rendering of the map no network traffic: the implication could mean overlay. Also, adding a flood map archive, wherein various scenarios but it can alert task forces of saved flood maps for a given time period and such locations. amount of rain fall will be available, will be helpful Lastly, the recent calamity that happened here in so that it can be used for other useful probabilistic, Japan made us remember the devastating statistical, hydraulic or hydrologic models for flood experience that also happened in the Philippines management. Changes in flood height and flood last 2009. It was really difficult for us to flow can be inferred from rainfall data, flood depth, communicate with family and friends who were and other inputs to the simulation and forecasting away, while we were also waiting for the news models. from battery operated radios since there was no electricity anymore. These kinds of situations 5.自己評価 inspired our group to create a system that can As one of the CICP groups composed of foreign serve people: whether it is to help spread the students from different laboratories, we are warning, or just to know the situation of our loved grateful for the chance to interact with the NAIST ones who are in the disaster area. We hope that community, and share a little about our lifestyle our project can, even in a small way, help in these and culture. Moreover, because we all work in times of need. various fields of Information Science, our 6.References: inter-disciplinary approach to the problem our Flood information: project addresses proved helpful to see issues from different perspectives. This kept http://www.emdat.be/result-country-profile Ushahidi platform, manuals and documentation: us http://ushahidi.com/ open-minded to the creative contributions of each SwiftRiver platform: http://swift.ushahidi.com/ Mac OS X Server manuals for V.10.6 Snow member and further enhanced our solutions. Leopard Heat maps: http://flowingdata.com/2010/01/21/how-to-make-aheatmap-a-quick-and-easy-solution/ The CICP project also gave us the opportunity to practice what we have learned so far in NAIST and create a working system that can be For the Poster: beneficial to others, especially to our home Crowdsourcing definition: en.wikipedia.org/wiki/Crowdsourcing countries. When we started this project, we only Bayanihan definition: had a vague idea on how the Philippines handles en.wikipedia.org/wiki/Bayanihan Flood information: its flood problems, and we did not know how we http://www.emdat.be/result-country-profile can realize the system we planned for the flood map. But now, with the help of our professors, we were able to know the where to start, what kind of 56 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」研究提案要旨 1.プロジェクト名 (申請書の内容をそのまま記入. 変更不可) 新聞を読みマーケットの動向を予測する AI~自然言語処理的マーケットシミュレータ~ 2.プロジェクトリーダー (変更不可) 所属講座 自然言語処理学講座 学年 M1 学生番号 1051075 e-mail アドレス 氏名 男 /鳥倉広大 [email protected] 3.分担者 (変更可) 所属講座 学年 学生番号 e-mail アドレス 氏名 言語科学講座 M1 1051003 男 /井岡孝徳 [email protected] 自然言語処理学講座 M1 1051027 男 /笠原誠司 [email protected] 自然言語処理学講座 M1 1051063 男 /田尻俊宗 [email protected] 自然言語処理学講座 D1 0961024 男 /吉川克正 [email protected] 4.チューター(※必須.本研究科専任教員 伝票に関する責任者)(事情により変更可) 所属講座 職名 自然言語処理学講座 教授 氏名 男 /松本裕治 e-mail アドレス [email protected] 5.必要経費(※応募時点での見積書添付は不要) 金額(千円) 設備備品費 支出予定月 150 2010.8. 品名・型名・数量/行先・目的・日数等 Dell Precision T7500 人 工 市 場 構 築 及 び Web ニュースクローリング用サーバー 137 消耗品費 2010.8 日経全文記事データベース(1 年分) 33 2010.8 ファイナンス・機械学習・データマイニング に関する書籍 20 冊 50 2010.8 旅費(調査目的も可) キーボード・マウス等のインタフェース 330 2010.10 国際会議 EMNLP in USA(3 泊 4 日 10 月) (研究調査,2 名) 合計 700 (交付額は8月に通知) 57 6.プロジェクトの背景と目的 近年,株式を始め,為替,商品先物などの多彩な市場が個人投資家を含めた様々な市場参加者 にとって容易に取引可能になり,それに伴って拡大・複雑化する市場の動向を適切に捉え,予測 する枠組みの必要性が高まっている.その要求に応えるマルチエージェントを利用した人工市場 シミュレーションの試みは早くから行われており,レートの動きや取引量など,数値化された情 報を扱ったテクニカル分析手法を実装する手法では一定の成果を見せている.一方,新聞や Web ニュース,企業や政府機関のレポート等,数値化されていないテキスト情報を元に市場を捉える ファンダメンタル分析を人工市場に組み込むことは困難なこととされてきたが,近年のテキスト マイニング技術の発達により,テキストから有用な情報を抽出した上で,エージェントの判断材 料として与える手法が行われつつある[1].しかしながら,そのテキスト分析手法は初歩的なも のに過ぎず,テキスト情報を十分に活用できているとは言い難い.そこで本研究では自然言語処 理の先端技術を用いて,高度なレベルで解析したテキスト情報を組み込めるエージェントと人工 市場を構築し,シミュレーションによってその手法の有効性を確認することを目的とする.テキ ストの解析には時間情報解析の利用を検討し,本研究のシステムがそれのキラーアプリケーショ ンの一つとなることを期待している.また,本研究が完成すれば,より現実に近い環境で市場を シミュレートできることになり,金融・経済・社会への波及効果は極めて高いものと考えられる. [1] 和泉 潔ら, 人工市場とテキストマイニングの融合による市場分析, 人工知能学会誌, 2007 58 7.目的到達までの研究計画 テキスト情報 本研究の目的を達成するために求められ エージェント 提供 解析 るのは,データ収集,テキスト解析とニ News Server リクエスト ュースサーバーの構築,エージェントを 含む人工市場のシステム構築,そして実 ファンダメンタルズ 数値情報 テクニカル 験の 4 段階である.右に示すのはその模 提供 リクエスト 加速実験用人工市場 式図であり,その詳細を以下で説明する. テクニカル及びファンダメンタルデータの収集(8 月~9 月)担当:鳥倉 本研究では為替市場を扱うことを予定しているため,米ドル/円を基本に 2 年分収集する. 有料のデータを購入することも検討する.次にファンダメンタルデータとして,新聞社から 提供されている記事を同より,極性を評価する.また,極性をスコアで表現し,+3 や-5 な ど,程度まで含めて評価できる仕組みを 新記事 考える. レート変動率に基づく総合的な材料ス 記事とレート の対応付け コア付け(10・11 月)担当:鳥倉・井岡 材料スコア モデル学習 推定モデル スコア推定 +3 +3 -5-5 +1 +1 ニュースサーバ 張ら[2]の提案した株価変動率による新聞記事の極性評価手法を応用し,レートの変動率に 基づいて記事をスコア付けするモデルを過去のデータから学習する.例えば円が上昇(下降) した場合には,その時に出た円に対する記事を好(悪)材料とみなして,正(負)のスコア をつけたデータを訓練データとしてモデルを学習する.新たな記事が入力された時にはその モデルでスコアを推定することになる.記事は表層の単語列の他,形態素解析,構文解析を 行い特徴量とするが,もう一つ特徴量として有効なのが,時間情報だと考えている.例えば, 「昨夜,金融庁長官が政策 A を発表した」というように,“いつ” ,“何が起きた”という情 報は両方揃って初めて材料として意味を持つことが多い.そこで,本研究では記事から日付 などの時間表現と,述語などの事象表現を抽出した上で,各表現間の時間的順序を推定し, 特徴量として学習・推定に利用する.これらの解析済みデータはデータベースとしてニュー スサーバーに保存し,エージェントからのリクエストに応じて情報を返すように設計する. テキスト解析とニュースサーバー構築(9 月~10 月)担当:笠原・田尻 解析の前処理として,対象とする通貨ペアに不要な記事のフィルタリングと,記事を“物価” や“貿易収支”等,カテゴリへと分類し, 「物価に+3 の好材料有り」というような,クラス ごとの情報を与えられるようにする.テキストの分析には次のようなものを提案する. キーワードベースの辞書的極性解析(9~10 月)担当:鳥倉・田尻 「堅調」 , 「下方修正」などの経済的極性を明示的に持ったキーワードの辞書を作成した上で,形 態素解析済みの記事において,その記事全体に対するそのキーワードの比率により,極性を評価 する.また,極性をスコアで表現し,+3 や-5 など,程度まで含めて評価できる仕組みを考える. 59 8.決算の要約(※2末に確定.3月上旬に決算書を受け取り,記入すること) 金額(千円) 設備備品費 支出予定月 品名・型名・数量/行先・目的・日数等 84800 10-3 Mac book air 47800 10-3 ドキュメントスキャナ ScanSnap S150 39800 10-3 Life Touch NOTE(LT-NA70W1A) 8712 10-3 HDPN-U500P 18400 10-3 消耗品費 RealForce91UBK 3980 10-3 DH-HOME/U2 5040 10-3 キーボード(Natural Ergonomic Keyboard) 84291 10-3 書籍 22785 10-3 キ ー ボ ー ド (Happy Hacking Keyboard Professional2) 7000 10-3 マウス(Blue Track マウス) 8000 10-3 ヘッドセット(Bluethooth ワイヤレスステレ オヘッドセット) 旅費(調査目的も可) 160686 10 EMNLP(鳥倉) (研究調査) 160686 10 EMNLP(井岡) (研究調査) 言語処理学会(笠原) (研究調査) 44760 3 合計 696740 9.プロジェクトの状況および自己評価の要約 人工市場はスケジュールよりも早く達成した.夏休みは盆の数日以外全員で取り組んだのでその成果だと考えて いる.中間発表までに立てた目標は非常にハードな物であったが,皆学校に泊まり込みで間に合わせた.発表自体 も英語で約 25 分と,発表者の鳥倉としても初めての体験であったが,発表前に練習し本番では無事乗り切るこ とができた.その後は全体を通して何度か頓挫することがあった.米ドル/円を使うのが果たして正しいのか,人 工市場を使うべきか,時間特性は取れるのか,コーパスは日本語にすべきか英語にすべきか,等と言った点が主 な原因である.当初の目算と大きく外れることもあったが,この主な原因はリーダーである鳥倉の判断が遅れたこ とによる.ある程度検討したらあとはいつまでも考えるのではなく,失敗を恐れずに素早く行動すべきであった. ただ,皆かなりハードに動いてくれたため,決定後は作業そのものが遅くなるということはなかった. スプリングセミナーやオープンキャンパスでは,試みとしては興味を持ってもらえたものの結果が出ていなかっ たことと,考察が十分でなかったため見に来ていただいた人に,この研究にどういう意義があったのかをうまく 説明できなかったことが残念だった. 全体を通して言えることは,まず良かった所としてチームワークは決して悪くなかったということ,短期スパン で一人一人に与えられた目標を,ほぼ確実に終わらせることができたこと,チームで研究をするという体験が初 めてできたこと等が挙げられる.悪かった点としては,決断に時間がかかったこと.研究の対象を広げ過ぎたこと 等がある.これらを反省点とし今後各自の研究をする上で糧としたい. 60 2010 年度大学院教育改革支援プログラム「プロジェクト型研究提案」結果報告 プロジェクト名 新聞を読みマーケット動向を予測する AI プロジェクトリーダ 鳥倉 広大 1.概要(背景と狙い) 近年,株式を始め,為替,商品先物などの多 彩な市場が個人投資家を含めた様々な市場参加 者にとって容易に取引可能になり,それに伴っ て拡大・複雑化する市場の動向を適切に捉え, 予測する枠組みの必要性が高まっている.その 要求に応えるマルチエージェントを利用した人 工シミュレーションの試みは早くから行われて おり,レートの動きや取引量など,数値化され た情報を扱ったテクニカル分析手法を実装する 図 1.人工市場イメージ 手法では一定の成果を見せている.一方,新聞 や Web ニュース,企業や政府機関のレポート等, 2.プロジェクトの進捗 数値化されていないテキスト情報を元に市場を それぞれが金融分野に明るくないということで,ま 捉えるファンダメンタル分析を人工市場に組み ず最初に金融知識を付けることにした.それぞれが 込むことは困難なこととされてきたが,近年の 本を読み,バーチャル FX をすることで金融分野の テキストマイニング技術の発達により,テキス 専門用語を身につけた.その後人工知能の作成に トから有用な情報を抽出した上で,エージェン 取り掛かり,予定より早く完成した.しかし,自然言語 トの判断材料として与える手法が行われつつあ 処理を用いて記事評価を行っている先行研究を調 る[1].しかしながら,そのテキスト分析手法は べて行くうちに,人工市場があまり適していないの 初歩的なものに過ぎず,テキスト情報を十分に ではないかという結論に至った.理由は二つある.一 活用できているとは言い難い.そこで本研究で つ目は,ほとんどの先行研究が SVM を使っている は自然言語処理の先端技術を用いて,高度なレ のに対し,人工市場に SVM を組み込むことが困難 ベルで解析したテキスト情報を組み込めるエー であったことが挙げられる.二つ目は,人工市場そ ジェントと人工市場を構築し,シミュレーショ のものに対する疑問である.人工市場の中にあるエ ンによってその手法の有効性を確認することを ージェントと呼ばれる人工知能が,その学習アルゴ 目的とする.テキストの解析には時間情報解析 リズムとして遺伝的アルゴリズムを用いているのであ の利用を検討し,本研究のシステムがそれのキ るが,これが最適かどうか我々が判断できず,それ ラーアプリケーションの一つとなることを期待 に対する代案を投げかけることもできなかった.また している.また,本研究が完成すれば,より現 エージェントはそれぞれが重視する「要人発言」, 実に近い環境で市場をシミュレートできること 「短期金利」と言った 17 のカテゴリを持っているが, になり,金融・経済・社会への波及効果は極め このカテゴリ作成には高度な金融知識が必要であ て高いものと考えられる.したがって,自然言 ることである.さらに先行研究によると,記事のカテゴ 語処理技術を用いることによる優位性を示すた リ分けは決定木によるものであり,その決定木を作 めに,金融分野で使われている数値解析による 成する際にも金融知識が必要であることがわかった. 株価予測は敢えて使わないものとする. そのため,記事毎にカテゴリ分けをするということは, 61 我々の研究の範疇を超えているように思われた. 「助詞によって繋がっている2文節の主辞と助詞」 しかしこれらの理由よりもさらに致命的だったことは, の2種類を指す. 自然言語処理による優位性を見出せそうでないと 考えられたことである.記事評価に自然言語処理技 術を用いても,それに対しエージェントというフィル ターがかかるためドラスティックな改善は見込めな いのではないかという判断に至った. 自然言語処理技術を使い記事評価を行う研究を調 図 2.語句 べて行くうちに,四つの手法で株価動向を予測す ることになった.全ての手法において,株価データと 大まかな流れとしては,まず,学習データの日ごと して1991年の日経平均株価を用い,学習,テスト について,記事に含まれる語句の評価値をその日 データとして同年の日本経済新聞を用いた.7月か の株価データの変動値に応じて加算する.その後, ら12月にかけての6ヶ月間において,月ごとに直前 株価を予測したい日について,その日の記事に含 の6ヶ月によって学習を行った後,株価が上がるか まれる語句の評価値を足し合わせ,その値の正負 下がるかの二値分類を行った.以下でそれぞれの によって変動予測を行った.その結果,54%の精度 手法について述べる. となった. 一つ目は,tf-idf と高村らの単語感情極性対応表を 三つ目は,映画の評価を利用した,記事の感情分 組み合わせて予測する手法である.tf-idf とは,文章 析に着目したものである.これは,映画に対する評 中の特徴的な単語(重要とみなされる単語)を抽出 論を用いたもので,そこには 5 つ星でその映画に対 するためのアルゴリズムであり,tf(単語の出現頻度) する評価がついてあった.この評価を用いてその評 と idf(逆出現頻度)の二つの指標で計算される. 論の文書をラベル付けし,それを訓練データとして tfi ni /( sum)( nk ) サポートベクタマシンにかけることで記事がポジティ idfi log[| D | / | {d : d in ti} |] ブかネガティブかという分析を行おうというものであ ni は単語の出現頻度,(sum)nk はその日に出現し る. た単語出現頻度の総数,|D|は学習データの総日 この研究をベースに,記事だけを読み株価の上げ 数,|{d : d in ti}|は学習データのうち,単語 i を含む 下げを予測するためにまず必要だったことは,いか 日数である. にしてラベル付けを行うかということであった.先行 一方,単語感情極性対応表は,55125 個の単語に 研究は記事に対する評価がついていたが,新聞記 つ い て ,その 語 が 一 般 的 に 良 い 印 象 を持 つ か 事にはそのような評価はなかったためである.これ (positive)悪い印象を持つか(negative)を-1〜1 の値 は言い替えると,記事が発効され,その記事が株 で表したものである. 価に最も影響するタイミングを知る必要があったと これらの二つの値をかけ合わせたものを各単語の いうことである. 株価影響指数とした.その後,株価を予測したい日 これを知るため,以下の式を用いた. について,その日の記事に含まれる単語の株価影 Ld cd n od n (n 0,1,2...30 ) 響指数を足し合わせ,その値の正負によって変動 予測を行った.その結果,50%の精度となった. 二つ目は,新聞記事内の語句ごとに評価値を定め, d が新聞の発行日. Ld が日付 d のラベル. c と o それに基づいて未知の記事を評価し,その日の株 がその日の終値と始値である.この n の値を変え 価変動を予測する手法である. て行き,記事に対し最もクリティカルに連動す ここでの語句とは,「同文節内の連続する2単語」と る日を探った.結果として,株式市場は新聞記事 62 が発効されたその日に最も影響されることがわか り組んだため間に合わせることができた.発表自体 った. も英語で 25 分程と長かったが,練習した分落ち着 よって新聞記事に対しその日の終わり値から始 いて取り組めたと思う. め値を引いた値をラベルとした.評価は先行研 最終的な成果は,二値分類にも関わらず精度が 究と同じく二値分類を用いるため,このラベル 55%と,低い結果しか出せなかった点は反省すべき の正負先行研究のポジティブ・ネガティブと対 点である.ただし,多少なりとて目論見通りに精度が 応付けした.素性として単語を用いた.先行研究 上がったことは,今後の研究への一歩と前向きにと ではストップワーズは特に抜いていなかったよ らえたい. うだが,本研究では助詞と記号に関しては使用 肝心の時間特性の取り方があまりうまく行かず,結 していない.こうして訓練データを用意し,7 月 局は手作業に頼る部分が大きかったので,これもも から 12 月までの新聞記事を月毎にサポートベ う少し工夫が必要だった.英語と違い日本語で時制 クタマシンにかけて行き,その精度を測った.な を取るということが思いの外難しく,この部分に着手 お,各訓練データはその前 6 カ月分の記事を利 する時間をもっと取ると良かった. 用している.結果として,52%の精度となった. また本研究は見せる部分の少ない研究のため,ス 四つ目の手法は,上記三つ目の手法に加え,係受 プリングセミナー及びオープンキャンパスの一般公 け関係及び時間特性を使用したものである.文が指 開に向けて,いかにこの部分を分かり易くするかに す時間軸に注目し,景気変動に影響しそうな物に もう少し時間を費やす必要があった. より大きな重みを付けようとした.時制で言うと過去 もっとも大きな成果は,チームワークを活かすことで, 形で書かれている文書よりも現在形で書かれてい 途中頓挫することがあったとは言え,都度立ててい る文書の方が,これからの株価推移により大きく影 た目標を達成し続けることができたことである.この 響するということで重みを大きくした.時制について ことは,今後各メンバーが研究する上で大きな自信 は,係受け関係を取り,助動詞「た」が動詞にかか につながると考えている. っているものを過去形とすることで判別した.さらに 最後に,これは結果論でしかないが,自然言語処 記事の日付にも着目し,文が指す具体的な日程が 理技術を用いるだけでなく金融分野の予測アルゴ 記事より未来か過去かを判別した.その他は手作り リズムも併用して使わないと,本当に精度の高い人 で辞書を用意し,「今後」や「かつて」と言った時間 工知能を作るのは難しいのではないかということが 軸を表す際に使われる語を用意し,時間軸を判別 わかった.逆に言うならば,金融分野のアルゴリズム した.結果として,精度は 55%となった. で予測をする際の補助ツールとして,自然言語処 理技術による予測システムを使うのが最も効率的で あると言える. 4.今後の展開 今回使用したデータ,インターフェース,手法, ノウハウなどは,非常に役に立つ物であり,こ れらをベースとして,もっと新たな手法を用い て株価変動予測の精度向上を目指したいと考え ている. 図 3.時間特性による重みづけ 3.成果 具体的には,今回使用したデータは新聞記事 中間発表までは非常に良いペースで進んだ.発表 と,一部の公開されているコーパスのみであっ でデモできるように人工市場を完成させておくとい たが,よりリアルタイム性の強い,twitter など う目標はややハードではあったが,皆一丸となり取 のマイクロブログの情報を取り入れれば,まさ 63 に今起きている問題に対する株価変動の予測に いずれにせよ,敢えて機械に予測をさせるとい 応用できるのではないかと考えている.対象物 う強み,そして自然言語処理を用いることによ という点では,日経平均のみに特化すのでなく, る強みを意識し,今後の研究に取り組みたいと 業界別,できることであれば企業別にした方が 考えている. 良いとも思う.というのも,日経平均では新聞 また全体を通して,各メンバーがチームで研究 に対し劇的な変化が見られないため,本研究で をすることの難しさを学んだ.単に与えられた 作った予測プログラムが十分に機能しないと考 仕事をするのではなく,それが研究全体の位置 えられるためだ.今後は対象の幅を広げて行き づけとしてどういう意味があるのか,それが他 たい. の人にアサインされている仕事とどう関連があ また,今回のプロジェクトでは,主にキーワ るのか等,リーダーに限らず各メンバーが全体 ードに注目し,それに加えて時間特性を取り込 を見渡して動かなければ作業効率が落ちる.こ こむことで予測精度を高める事を試みたが,マ れは今後各自で研究をする上でも通用すること イクロブログなどでは,新聞記事に比べて感情 で,今自分のしている仕事が全体のどの位置に 表現が豊富であるという特徴があるため,それ あたるのか,そのペースでいくといつまでに目 らの情報を加味する事でより人間らしい株価変 標到達できるのかと言ったことを意識できるよ 動を予測する事ができるのではないかと考えて うになると思う. いる.研究をしていく上で,このように人間の感 5.自己評価 情を読み解く必要性を強く感じるようになった. 見せ方の難しいテーマだったので,インター 株式市場とは人間心理が複雑に絡み作り上げら フェース面にも注力したにもかかわらず,結果 れる物であるため,大衆の感情を捉えることは としては周囲の評価はあまり得られなかったの 株式市場動向を捉えることと同義であると言っ は残念であった.もし次回,同様のテーマに取り ても過言ではないためだ.すなわち,オンライン 組む機会があれば,さらに見せ方にこだわりた にリアルタイムで人々の感情が文字データとし いと思った.それは予測の的中率に限らず,自然 て表される twitter を有効活用することは,本 言語処理においてどのような新規性を生み出し 研究の目的を達成するために非常に有効な手段 たのかという部分を見せるという点でも同様で となるのではないかと考えている. ある. 今回のプロジェクトでは,最終的な正解率で また,株価予測については,たくさんの書籍 の手法比較しかおこなわなかったが,どの手法 を読み,様々な手法を試してみたが,当初から がどのような状況時に弱く,あるいは強いとい 感じていたとおり,結果をあげるのは難しかっ う部分が解析できれば,新たな知見を得る事が た.しかし,検討して行くうちに発見した様々な できるとも考えられる.そのためには,より多く 問題点や,まだまだチャレンジできる部分は残 実験を行う必要があり,今回のように議論過多 されており,時間の許す限りもっと上を目指し になってはいけないということは非常にいい教 たいと感じた. 訓となった. 限られた時間の中で,ある程度の成果を出す 最終的には目標として,ある程度まとまった成 事は厳しい部分もあったが,完成させることが 果物ができれば,オープンソースとして公開し でき,チームワークが生み出す力の大きさを感 たり,他人の手法と比較できるようにする,あ じた. るいは,もし高精度で推測する事ができるよう このプロジェクトがきっかけで,後に繋がる になれば,しかる機関に情報提供する事で社会 ノウハウも蓄積できたので,非常に良いチャン に還元する事もできるかもしれない. スを与えてもらったと感じた.中でも勉強にな 64 ったことは,我々は夏休みからほぼ毎週ミーテ ィングを重ね,研鑚を怠ることはなかったにも 6. 謝辞 関わらず,進捗としてはあまり好ましくなかっ ご指導いただいた松本祐治教授,お忙しい中メン たという点である.議論だけでなくとにかく手 バーに加わり研究の方向性を指導いただいた吉川 を動かすという,研究として本質的に欠かすこ 克正氏,並びに相談に乗っていただいた研究室の とのできない部分について改めて学ぶことがで スタッフの皆さま,先輩方,同博士前期課程の皆さ きたことは,今後各自が研究して行く上で大き まに心より感謝致します. な財産になるのではないかと思う. 7. 参考文献 プロジェクトの成果物以外にも,予算運用の [1]Bo Pang, illian Lee, Shivakumar 仕方や,スケジュール管理,チーム全体で意識 Vaithyanathan を共有しながらプロジェクトを前に進める事の Thumbs up? Sentiment Classification using 難しさなど,授業や単独の研究では経験できな Machine Learning Techniques い事も学ぶ事ができ,プロジェクト開始前と終 [2]Moshe Koppel, Itai Shtrimberg 了後では,物事の考え方が大きく変わったと感 Good News of Bad News? Let the Market Decide じた. [3]和泉 潔,松井 宏樹, 松尾 豊 自身のプロジェクトのみではなく他グループ 人工市場とテキストマイニングの融合による市場分 のアイデアや,プレゼンテーションスキルにも 析 感心させられる点が多くあり,知識の向上だけ [4]張 へい,松原 茂樹 ではなく,これからのアイデアを考える際に 株価データに基づく新聞記事の評価 非常にいい刺激になると思う. 【付録 ポスターセッション投票結果】 1 日目 2 日目 合計 大杉直也 金03、銀06 金02、銀03 金05、銀09 Erlyn Manguilimotan 金01、銀03 金03、銀04 金04、銀07 井元兼太郎 金03、銀10 金00、銀01 金03、銀11 幾世知範 金01、銀05 金04、銀04 金05、銀09 水井俊文 金13、銀03 金11、銀05 金24、銀08 MEJIA Ramon Francisco 金11、銀02 金14、銀07 金25、銀09 鳥倉広大 金01、銀04 金01、銀03 金02、銀07 65
© Copyright 2026 Paperzz