データジャケットを用いたイノベーションゲ ームからのデータ可視化手法創成

人工知能学会研究会資料
SIG-SWO-A1401-03
Tangled String: データジャケットを用いたイノベーションゲ
ームからのデータ可視化手法創成
Tangled String: Method for Sequence Visualization Created based on Proposals in
Innovators Marketplace on Data Jackets
大澤 幸生 1,平岡 美那子 1,野神 航一 1,劉 暢 1,早矢仕 晃章 1
Yukio Ohsawa, Minako Hiraoka, Koichi Nogami, Chang Liu, and Teruaki Hayashi
1
1
東京大学大学院工学系研究科・システム創成学専攻
Department of Systems Innovation, School of Engineering, The University of Tokyo
Abstract: Innovators Marketplace on Data Jackets is a gamified workshop for presenting creating
scenarios to combine and analyze data based on shared metadata, without disclosing contents of the
data. Here the least necessary digest information about given data is described in a data jacket (DJ) and
published, on which latent links among datasets are visualized on a game board. On this map,
participants propose, criticize, purchase, sell, and call for ideas to combine/analyze data and analysis
tools that may be untouchable, i.e., confidential or hidden. Requirements for additional data and tools
as well as scenarios for analysis are presented in the process of IMDJ. In this paper we present a case
where Tangled String, a tool for visualizing sequential data has been created from the process.
1 はじめに:チャンス発見プロセス
ビッグデータの条件とされるデータの大きさ
(volume)、多様性(variety)、変化の速さ(velocity)
の持つ可能性とこれを利用する上での技術的課題は、
広く社会に認知されつつある。しかしながら、volume、
variety、velocity が大きければビッグデータへの期待
を満足できるというものではない。データの多様性
が高ければデータを合成したデータの変数の個数は
増加し、どの変数集合について関連性を抽出すべき
かについて候補が爆発的に増加する。属性選択[1,2]
技術はこの問題にストレートに切り込む技術周知で
ある。しかし、データをクラスに分割するためでは
なくクラス境界の重要性を説明するための変数を残
す、あるいは生成することも実用上必須である。例
えば、哺乳類か爬虫類か区別のつきにくいカモノハ
シのような曖昧なサンプルがあったとき、なぜ曖昧
であるのかを説明するために「単孔類」という新概
念を導入し、その意味について理解するため「肛門
と尿生殖口が分かれているかどうか」という変数を
導入するように。
特に、データのサイズが大きく、扱う世界の変化
も速い場合には例外的なサンプルも混入しやすくな
る。この例外的なサンプルは、出現確率の低いパタ
ーンとしてデータに混入するものとして観測される。
そのパターンが一つの事象である場合の扱いとして、
データマイニングによる知識発見プロセスにおける
前処理でノイズと見なし削除することもある。その
反対に、希少な事象がリスク要因を孕む可能性を考
えて、希少事象の予測手法[3,4]や例外的なパターン
の発見手法[5,6]も技術的に円熟期に入っている。一
方、特定の希少事象を予測するのではなく、意思決
定のために利用できるかも知れない希少事象を発見
し利用シナリオまで創出するのがチャンス発見[7,8]
であった。
これらの文献以来筆者らはチャンスを、意思決定
ととって重要な影響を及ぼす事象と定義してきた。
意思決定は複数の行動シナリオから一つを選択する
ことであるから、チャンスは複数の行動シナリオの
交点になければならない。しかし、この逆は成立し
ないため、多数の可能な行動シナリオの交点に位置
する様々な事象の中からチャンスを選択するプロセ
スを実行する必要がある。そのため、事象の前後に
繋がるシナリオがもたらす価値の最大値と最小値の
差を評価することの方が意味を持つことを[7]で指
摘し、チャンス発見の理論的基盤をなした。ところ
が、最大値と最小値を評価するためにはあらゆるシ
ナリオの可能性を列挙するには、効率が低い。この
ようなわけでチャンス発見の研究は、許容できるコ
ストの範囲でビジネス現場の求める価値を生み出す
行動シナリオを創造する目標に収束してきた。
この目標設定では多様なシナリオを包括してマッ
プ上に可視化する技術[7]やコミュニケーション支
援、類推[9, 10], 洞察[11]、メタ認知の支援[12]を連
携させるシナリオ創造プロセスの開発研究を核とし
て進めることが重要となる。このプロセスの単純化
は困難なテーマであるが、二重螺旋プロセスと呼ぶ
モデルで人とコンピュータが連携して発見を進める
ことを筆者らは提案し企業等に導入してきた、この
プロセスは、次の様にまとめられる。
まず、自分の行動に関係するかも知れないデータ
を、明確な境界を論ぜず、即ち過不足をおそれず身
の回りの環境から収集する。このデータを例えば
KeyGraph[13]で可視化すると、共起し合う高頻度の
アイテムが集まるクラスタ(島と呼ぶ)の間の境界
に、低頻度のアイデム(橋と呼ぶ)が現れる。この
橋と、これに連結する島の繋がりを解釈して新しい
行動のシナリオを読み取り、意思決定に結びつける。
即ち、橋の上や、橋と島の接点の位置に現れたアイ
テムあるいは事象をシナリオの分岐点すなわちチャ
ンスの候補として注目する。チャンス発見のプロセ
スには複数の参加者が、それぞれ随時独自に注目範
囲を絞ってシナリオを提案し合う。上記の「チャン
スの候補」は、これらのシナリオを接合し新たなシ
ナリオを生成する接点として用いるので、参加者の
ミッションはシナリオの接合を明確に目的としてチ
ャンス候補を絞り込んで行くことである。その時の
思考と会話の内容を文章して可視化するとメタ認知
の効果によって背景に潜む因果関係について解釈を
進めることが可能となる。この様に、環境から収集
したデータと参加者の思考・議論という二種類のデ
ータを可視化しつつ、人とコンピュータがそれぞれ
螺旋を進みつつ連携してゆく。
このように批判を活かしながら進める議論プロセ
スの中で、議論に関連するデータを集めてゆくこと
は心的・時間的負荷が高い。さらに、多くの成功事
例の背景には、目的意識を高めるための前段階やコ
ミュニケーションがあって、その負荷が分析そのも
のの負荷を上回ると報告されることもあった。
これらの負荷を軽減するため、遊びの要素を取り
入れたのがイノベーションゲーム®(Innovation Game
を改め Innovators Marketplace®: IM)である[16]。IM
の参加者は「起業家」か「消費者」のいずれかある
いは両方の役割を携えて発言する。起業家は既存の
知識や技術などの要素がどのように関係し合ってい
るかを KeyGraph などにより可視化したゲーム盤(マ
ップ)を見つつ、要素を組み合わせた製品やサービ
スの案と希望価格を示す。消費者は示されたアイデ
アを高く評価する場合は購入するが、そうでない場
合はアイデアの価格を下げる要求を出すか、質を上
げるための改善を促す。この時、ゲームであるとい
う前提は、質問や批判を許容する容認さを生み出す
効果を持つ。結果、起業家は獲得金額を競い、消費
者は購入したアイデアの質(新規性、有効性、実現
性等)をプレゼンテーションによって競う。IM で出
された提案を実現するため潜在的なステクホルダー
の都合まで表出させ、必要な問題を綿密に解決する
アクションプランニング手法も開発している[17]。
IM では、消費者の要求に答えるために必要な要素
が知識から欠落している場合に、これを補う提案が
生まれることもある。このような提案メカニズムを
データ収集に活かせる新しいゲームが、次に述べる
データジャケットを用いた Innovators Marketplace
on Data Jackets :IMDJ である。
2 イノベーションゲーム
有益な発想にとって必要なのは自由で発散的なア
イデアの列挙ではなく、組み合わせ要素を絞ったり
テーマを適切な粒度で設定したりする適切な制約設
計である。データの有する潜在的利用価値を発見す
ることは、言い換えれば利用者の要求に一致するよ
うなデータの提供者・分析者の提案を引き出すこと
であり、そのためには Finke の Geneplore モデル[18]
の様に、結合案の生成とその利用価値の探索を交互
に繰り返してゆくことが望ましいと考えられる。
市場において商品の提供者と消費者の間で提案と
評価というコミュニケーションが活性化すれば、こ
の創造的反復が可能となる。しかし、この市場の潜
在的効果は、現実には十分に生かされていない。既
に CKAN や data.go.jp の様にデータを公開する動き
チャンス発見手法を推進する中で、成功を挙げた
事例の特徴は、プロセス初期にチャンスへの関心が
ビジネスシナリオを得ようとする企業側にとってわ
かりやすく述べられていたことである。例えば、
「ビ
ールの売上げに関わる異常気象を予測したい」等の
要求の形で関心が表現されてプロセスは開始する。
言い換えれば「売上げに関わる異常気象を予測でき
るか?」等という問からスタートし、状況理解や行
動計画を議論するうちに、批判や問いを発生させな
がら新しい要求や制約を得てゆく。この様なプロセ
スは、設計対象としての行動シナリオ案を改善して
ゆく有効な手段である[14,15]。
3 データジャケットと IMDJ
とは別に、KDnuggets や Windows Azure Marketplace
は、Web ページ上で様々なデータのダイジェスト情
報を列挙して利用者を募るようなデータ市場となっ
ている。データの利用方法についてアイデアを示し
あうアイデアソンや、データの提供者に対して分析
者を募集し競わせるビジネスモデルも登場している。
しかし、両者を統合してイノベーションを促す本来
の市場の効果を実現したデータ市場は殆ど無い。
市場は、明確な意図をもって環境設定を行わない
限り、イノベーションの効果を失ってゆく。オンラ
インショッピングで物を売買するだけではなく、そ
こで消費者間、消費者と提供者が創造的なコミュニ
ケーションを行う環境を適切にデザインして初めて
イノベーションの効果が発揮される。データの市場
が現状では、データをイノベーションに活かす場に
はなっていないのは特に例外ではない。
IMDJ[19]は緩いルールを持つ市場モデルで、デー
タを組み合わせた活用・分析手法や新しいビジネス
モデルを、IM と同様に提案し評価し合うものである。
IM での知識補填と同様に、データの収集も行う。た
だし、データそのものは市場に陳列せず、データジャ
ケット(DJ)を導入する。DJ を用いて、多様なデータ
の共有/結合/収集、価値の発見と評価を可能とする仕
組みとした次の3ステップで IMDJ は進む(図 2)。
Step(1):あるデータについて所有するあるいは知る
人は、データ中に含まれる変数名のリスト、デー
タについて宣伝しておきたい概要や特徴を書き込
んだ、小さな情報を公開する。これが DJ である。
データの内容は所有者の都合で隠して良いが、DJ
にはデータ内容のダイジェストを所有者が書きた
いだけ書き、原則として公開する(非公開である
が IMDJ の場だけで利用可能とするオプションも
選択可: https://sites.google.com/site/datajackets/)。
例えば、電力関連企業における協力会社の技術的
能力維持状況についてのデータは、図 3 の DJ とし
て提出された。このように非公開とすべきデータ
の場合、簡単な概要とわずかな一部の変数の名だ
けを書き込んだ DJ を公開しても良い。このように
公開する変数名を DJ 公開変数と呼び、変数値まで
公開する公開変数と区別する。DJ にはデータの概
要説明と DJ 公開変数だけ含まれ、大規模なデータ
も DJ ではカード一枚程度に書き詰めることができ
る。解析者や利用者が名乗り出て、所有者が同意
できる条件を示すまでデータの中身は秘匿できる。
Step(2): DJ と DJ の間を、概要中の単語や DJ 公
開変数を介した関係性によって可視化したマップ
を作成する。DJ の内容から DJ 間の関連を可視化
し、IM 同様に発想を行うためである。
Step(3):Step(2)で作成したマップをゲーム盤として
IM を実施する。データのユーザと所有者が取引き
の条件(価格や、知識を発見した暁にはデータの
中身を共有するなどの約束)を決める交渉も進め
つつ、データを結合する解析手法とその用途を議
論する。ここで出た提案に対する消費者からの批
判や要求、評価に基づいて、アイデアの洗練と評
価を進めてゆく。必要ならば、新データの収集を
提言するため、新たな DJ をマップ上に追加する。
なお、需要者が多くても無料化すべき公共価値のあ
るデータもある。IM 上でのコミュニケーションから、
「本データの公開により犯罪を回避できる」など社
会の期待を知れば、社会的責任を重視するデータ所
有者は無料でデータを提供すると期待している。実
際、IMDJ 実施後は、高く評価された DJ の元のデー
タについてアクセス情報を追加報告する動機が高ま
ることを筆者らは検証している。ただし、そのよう
な場合も IMDJ のゲーム中は交渉の動機を高めるた
めデータに価格付が行われる。IMDJ での価格や交渉
は価値の認知状態を把握するためだけものもので、
実際のデータ共有は後に協議して決めるべきである。
図2
IMDJ における 3 ステップの手順[19]
図3
企業の提出した関する DJ の一例
図 4 IMDJ 実施例の結果:付箋が要求と提案である(白抜部分
には提案者、購入者の名が書かれていたため削除した)
図4
IMDJ に用いるマップ(ゲーム盤)の一部
現在、DJ は Web 経由で随時エントリー可能であ
り(https://sites.google.com/site/datajackets/)、公開可
能と設定された内容はこのエントリーサイトで表示
することができる。IMDJ で利用された DJ の登録者
には、どのように結合されどのように評価されたか
について、連絡するシステムを構築中である。
4 Tangled String: IMDJ からの Spinout
としてのデータ可視化ツール
図 4 は、IMDJ の終了時のゲーム盤の一例である。
この例では、人材育成、情報機器製造、ソフトウェ
ア開発などに跨る、IMDJ を初めて経験する 11 名の
参加者により、
「心豊かで安全な生活環境を実現(提
供)する」ことをテーマとして IMDJ を実施した。こ
れらの人々が、それぞれ役割を果たし互いの要求に
答え合うことは社会的に有益である。しかしながら、
生活の安全のために必要なデータが相互に提供され
る形で十分に共有されているとはいえず、その理由
としてデータがどのように利用されるかについての
不透明であることが参加者等により指摘されていた。
ここでは、想定外の効果も期待してランダムに選ん
だ各種データ等を 39 枚の DJ とし、結合するとどの
ような成果が期待できるかという議論を実施した。
① 「DJ1: 創造的アイデアの発想結果」
「DJ2: 身体20箇所移動の座標データ」
「DJ3: 創造的思考者の映像データ」
を結合することによって、
「メンタルケアのでき
るアナログゲーム」を提案している。これは、
図中に見える「災害時におけるメンタルケア」
なる要求に答えて提案されたもので、IMDJ で利
用者から高い購入実績を得た。実際、災害によ
って心的外傷後ストレス障害(PSTD)を患うと、
人の行動は小さな音などの外的刺激により行動
が大きく変化するような状態が続く他、創造性
と心的障害に関わりについても報告がある(後
述)
。行動センシングによって行動急変の初動を
見出し創造性に関わる行為との関連を観察する
ことは意味があるであろう。
② 上記 DJ2 が包含する「手術室内での人の動き」
を用いて「トラブル時の動きと、物の供給のあ
り方を導き出す」を収集する提案が出された。
迷った時や急な震災時は、棚から薬品を取ろう
としていても周囲を振り返ったりして行動が予
定から乖離してしまうこともあるので、どのよ
うな行動変化が実際に起きているかを分析して
おく必要がある。この場合は、変化点以降の行
動は不安定でバラエティがあると考えられるた
め、行動パターンのパラエティを増加させる行
動を抽出するツールを開発しなければならない。
③ 「DJ4(貧困問題とテロ事件をまとめて記載した
:
ような)相互に関連付けられた災害情報」と、
「DJ5: Twitter, facebook のエントリー(オンライ
ンコミュニケーションのログ)、人間関係」を結
合して「情報の信頼性格付け」を行い、これに
よって「信頼性と説得性のある情報」を得たい
との要求に応える提案があり、IMDJ で利用者か
ら高い購入実績を得た。即ち、交友範囲が広く、
議論において以降の注目を得るような話題の口
火を切った発言者に絞った上で、実際の災害情
報と一致する発言をした人物を見出しその人物
の発言を高く評価するような手法を提案したも
のである。このうち、議論において以降の注目
を得るような話題の口火を切った発言者の抽出
のための技術として、[20]の様に影響力の高い発
言を抽出する方法も考えられるが、facebook の
ように教養の高い友人同士が集まることのある
コミュニティーにおいては、先導的な参加者は
ただ以前の発言を引用するのだけはなく、新し
い視点を持ち出して話題の豊かな広がりを見せ
る。特に、災害のように生起直後は「何が起き
たのか」
「何をすべきか」という解釈が分かれる
事象に関する注目発言としては、以降の発言の
単語ベクトルを揃えるような字面の影響力では
なく、論点のバラエティを増加させる発言を抽
出すべきであろう。
以上、①~③のように、IMDJ からは新たなツール開
発の統一的なニーズが得られることがある。この場
合において、①~③を統一すると、多様な時系列を
発生させる変化点 t0 とその後の様子がおよそ把握で
きるような可視化ツールが必要であることがわかる。
即ち、ある時刻 t0 において生起した事象 Xt0 があった
とき、ti: (= 1,2,…n) > t0 なる時系列 t1, t 2, t3, …tn に相当する
Xt1, Xt2, … , Xtn における長さ2以上の同じ部分系列
の繰り返しを抽出するのではなく、むしろ Xt0 が現れ
た直後に多様な系列が発生することを検出すること
が求められる。
上のような要請から筆者らは、可視化ツール
Tangled String の開発にかかった(図 5)
。これは、
・身体の動きにおける各身体部分の動き(①②)
を離散化した記号
・会話における発言、単語の出現(③)
などを時系列データとして発生順に並べ、これを一
本の糸で表すものである。例えば議論における発言
録が対象である場合、ある時刻 t0 付近にあって t0 以
前の時点 t(即ちウィンドウサイズ dt に対し t0-dt < t
< t0)で用いられた単語が出現すると、糸は絡まるよ
うに時点 t に戻る。その結果、糸の上には随所に絡
まった塊ができる。この塊一つが議論中に生まれた
一つの話題を表し、塊と塊を結ぶ部分の糸は直前の
話題から新しい話題に移行する発端を表す。一つの
塊には、途中で糸の戻り発生したことによる複雑な
絡まりが含まれることもあり、その場合にはさまざ
まな単語で表される高度な概念が述べられているこ
とを意味する。又、塊ができると、その塊の最初の
時点と最も多く後の時点が戻ってきた時点によって
代表する。前者において現れた語は話題の起点とし
て、後者は話題を表す代表的な語として表示する。
このようにして Tangled String (以下 TS)は、離散化さ
れた系列データから、上記の塊の発端に現れアイテ
ム(事象、単語、商品など、系列の構成単位)と、
塊の中で頻出するアイテムが繋がる様子を可視化す
る。絡まりのため塊の形状が複雑になった場合も、
頻出する部分系列を短縮せず可視化するため、頻出
パターンを抽出するようなステップは含まない。た
だし、図が複雑になりすぎる場合は数点おきに間引
いてアイテムを結ぶ意図を表示することはある。
例えば、上記の①②について TS は、Kinect により
収集された人体の運動から急な身体運動の変化にお
ける初動、すなわちきっかけとなる外部刺激への反
応を示す運動を抽出することができる。図 5 は Kinect
で収集した身体の20関節の運動(DJ2)データを
TS により可視化した結果であるが、室内で創造的思
考内容を書き出した瞬間に 20_1(右足首の動きの加
速)など特有の動きがあったことを示している。ビ
デオ映像(DJ3)を DJ2 に該当する情報と照らし合わ
せると、時系列上でこれらの 20_1 が出現した時点で
は、回転椅子に座ったまま左足を軸として回転し、
周囲の情報を見渡す行動が行われていた。即ち、考
えが行き詰ったり情報不足に気づいたりした際に、
新たな情報を収集する行動をとっていたことが分か
る。これは直接メンタルケアに関係しないが、PSTD
に効果を発揮する瞑想手法が創造性の増強効果もも
たらすこと[21]や、メンタルな問題を有する人が特
異な創造性を発揮することも知られている[22]。
更に③については、図6のように議論で話題の起
点となる発言を抽出し、前後の文脈変化との繋がり
を糸状の図で可視化することによって、注目される
発言がどの前後の文脈とどのように関連しているの
かについて理解を促進する。この例では、
「総理」の
ように新しい話題のきっかけを作った(発言するこ
とではなく攻撃されることによって)人物や、
「自衛
隊」
「攻撃」や「戦闘」など、現在でも深刻な国家的
問題に繋がる話題の発端を捉えている。
以上のように、IMDJ の結果に基づいて生まれたツ
ールにデータの領域を超えた利用可能性が発生する
ことがある。この理由は、ワークショップとして実
施する IMDJ では本例のように「豊かで安全な生活
環境を実現」のような一般的なテーマを設定して
IMDJ を実施し、その中でこの話題をブレイクダウン
した要求を発せしめ、その要求に答えるデータ結合
案を得ているためであると筆者らは考えている。こ
の他には、
「原子力システム高経年化(特に安全性評
価)を実現する」なるテーマで実施した IMDJ から
可視化ツール[23]を開発する成果を得ている。IMDJ
で得られるデータ分析案は二段階高次の一般的なテ
ーマに向けて発せられたものであり、直接答えよう
とした要求以外の用途にも役立てやすい。
5 Tangled String の原型と改訂過程
図 5 オフィスにおける人物の行動(Kinect で取
得)の TS による可視化。絡まりの度合いが密→
粗、粗→密と遷移するところに 20_1 が見られる。
図 7 は、図 6 と同じ議論ログを[24]の手法で可視
化したものである。同手法は、図 8 の様に系列デー
タの全体にまんべんなく現れるアイテム(出現位置
の分散が大な単語や事象)を円の中心に、数箇所に
偏在するアイテム(分散が小)を円周付近に、系列
順に時計回りに配置する。議論ログを対象とする場
合、系列の中で中心的な話題を表す単語を中心とし
て議論の流れが回転してゆく。遷移する話題は、混
合ガウスモデルにより単語ペア生起分布の異なる時
区間として着色する。トピックが入れ替わり現れる
議論については,発言間の単語ベクトルの類似性か
ら捉えたトピックごとに円を分割して可視化する.
TS は、この手法を元に IMDJ で得られた提案を実
現するために発案したものである。TS は、[24]の手
法で円の中心に相当する主題が遷移してゆく様子を
可視化することに当たる(図 9)
。様々な粒度の話題
間の遷移を可視化することは、ある直径の円を周回
する途中で異なる直径の円に遷移することに当たる
ため、TS の可視化では円形という制約を破り絡まり
ながら伸びる糸状とした。設定されたしきい値より
短い時間で消えてしまう語系列のパターンが入れ替
わり出現する場合、[24]では前後と重なる話題が時
間順に連なるものとして可視化される。一方、TS で
はこれらの短区間が一つの共通のアイデム(語)を
含む場合は互いに絡まり合い、長い区間が現れるま
で塊を作り続ける。これは、①~③で異なるパター
ンの系列が交錯する様子を可視化するためである。
図 6 小泉・岡田対談(2004)の TS による可視化。
「自衛隊」「攻撃」や「戦闘」など、当時だけで
なく現在でも深刻な国家的問題に繋がる話題の
発端を捉えている。
図 7 図 6 と同じ討論の[24]における可視化
図 8 [24]における議論マップのモデル図
図 9 図 8 のモデル図から Tangled String への展
開:回転の中心は遷移する。
図 10
IMDJ 実施時からの修正とデータ更新
6 考察
IMDJ において提案された内容を実現するために TS
を開発した経緯を述べてきたが、プロセスの中では
実際にはデータ分析/可視化あるいはシミュレーシ
ョン等のツールもデータの一種として扱い、その要
約と入出力変数を DJ として登録してゆくことがで
きる。この様子を、図 10 の左端に示した。これによ
って、自作したツールの用途考案を IMDJ 上の議論
に委託することが可能となる。
図 10 のように、toolx なるツールを概説する DJx
が IMDJ において提案に関連すると一旦考えられた
ものの、検討の結果提案に含められない場合、修正
案 DJ’ x を検討する段階で改訂案 tool’x が着想される。
実際、[24]では「(前略)個々の発言がなされた時間
情報を利用して、議事録から議論構造を自動的に可
視化する(中略)単語の登場箇所のばらつきや頻度
からトピックやキーワードを段階的に抽出すること
ができる」と示されていたが、この記述のうえい先
述の①②③の提案を実現する上で、即ち中心的話題
を遷移させる上での障害は「ばらつきや頻度」によ
り円の中心と周辺に語を配置する仕組みだけであっ
た。この障害を除くだけであったので、TS ではアイ
テムの中心性を求める数値計算を行わない。これは、
図 10 の①の改訂更を行ったことに当たる。
IMDJ の提案を改訂するには、①の他にデータを差
し替える②や提案を改訂する③、提案により新しい
要求を呼び起こす④、要求を提案に応じて変化させ
る⑤などが考えられる。⑤は提案の変化に適応して
要求を変化させるパターンであり、技術の革新によ
りビジネス目標を発展させるのに類似している。
7 むすび
DJ を介して多様なデータの関係を可視化し、チャン
ス発見プロセスにちなんだ創造的コミュニケーショ
ンを実施することによって、隠れたデータの価値を
掘り起こすことができる。この時、データマイニン
グや可視化ツールが、データの価値を掘り起こす道
具として位置づけられることになる。十分にこの価
値の掘り起こしができない場合にはツールを修正、
改訂することができる。[24]から Tangled String への
変化は改訂というよりも、全く異なる姿態の結果を
出力するため、一見すると大きな飛躍に見えるであ
ろうが、今述べているように実際には IMDJ のプロ
セスの中ではごく自然な変化に過ぎない。この事例
に見られるように、データを利用する方法自体のイ
ノベーションにとっても、市場原理がダイナミクス
の有効な基礎となると筆者らは考えている。
参考文献
[1] Kira, K., Rendell, L.A., A Practical approach to feature
selection, Prof. Int'l Conf. Machine Learning pp.249-256
(1992)
[2] Zhou, H., Hastie, T., Regularization and Variable
Selection via the Elastic Net, J. Real Statistical Society
Ser. B., 301-320 (2005)
Engineering Design, Kluwer Academic Publishers,
[3] Joshi,M., Kumar,V., and Agrawal, R.,Predicting Rare
Classes: Can Boosting Make Any Weak Learner Strong? ,
Boston (2004)
[16]
Ohsawa, Y., Innovation Game as a Tool of Chance
The 8th ACM SIGKDD International Conference on
Discovery,
Knowledge Discovery and Data Mining (KDD'02) (2002)
Conference on Rough Sets, Fuzzy Sets, Data Mining and
[4] Weiss, GM.,
and Hirsh, H., Learning to Predict Rare
Events in Event Sequences, In Proceedings of the Fourth
International Conference on
Data Mining (KDD-98),
Proceedings of
the
12th
International
Granular Computing, Delhi, India
[17]
Hayashi,
T.,
and
Ohsawa,
Y.,
Processing
Knowledge Discovery and
Combinatorial Thinking: Innovators Marketplace as
AAAI Press, Menlo Park, CA,
Role-based Game plus Action Planning, Knowledge and
359-363 (1998)
Systems Science (2013)
[5] Suzuki, E., Watanabe, T., Yokoi, H., and Takabayashi, K.:
Detecting Interesting Exceptions from Medical Test Data
with Visual Summarization. Int'l Conf. Data Mining
315-322 (2003)
[18]
Finke,R.A., Ward, F.B., and Smith, S.M., Creative
Cognition, The MIT Press, MA, 1992.
[19]
Ohsawa, Y., Kido, H., Hayashi, T., and Liu, C. 2014.
Innovators Marketokace on Data Jackets, for Valuating,
[6] Yamanishi, K., Takeuchi, J., William, G., and MIlne, P.,
Sharing,
and
Synthesizing
Data,
appear
mixture with discounting learning algorithms, Data
(extension of Data Jackets for Synthesizing Values in the
Mining and Knowledge Discovery 8(3), 275--300 (2004)
Market of Data, Procedia Computer Science 22:
学出版局(2006)
Fountains of Chances, in Chance Discovery and
Management,
Proc.
International
Conference
on
in
Practice
709-716.)
[20]
[8] Ohsawa, Y., and Fukuda, H., Potential Motivations and
Systems
in
Knowledge-based
[7] 大澤幸生:チャンス発見のデータ分析,東京電機大
Information
to
On-line unsupervised outliner detection using finite
松村 真宏, 大澤 幸生, 石塚 満: テキストによ
るコミュニケーションにおける影響の普及モデル,
人工知能学会論文誌 Vol.17, No.3, pp.259・67 (2002)
[21]
Travis, F. The Transcendental Meditation technique
Industrial Electronics, Control and Instrumentation
and creativity: A longitudinal study of Cornell University
(IECON 2000) (2000)
undergraduates. Journal of Creative Behavior 13: 169–
[9] Dietrich, E., Markman, A.B., Stilwell, C.H., Winkley, M.,
The Prepared Mind: The ROle of Representational
180, 1979.
[22]
White,
H.A.,
Shah,
P.,
Creative
style
and
Change in Chance Discovery, Ohsawa, Y., and McBurney,
achievement in adults with attention-deficit/hyperactivity
P., Chance Discovery, Springer, Heidelberg 208-230
disorder, Personality and Individual Differences, 50 (5),
(2003)
[10]
pp. 673-677 (2011)
Nakamura, J., and Ohsawa, Y., Shift of Mind:
[23]
薦田 和弘, 大澤 幸生, 複数文書の相対的特徴
Introducing a Concept Creation Model, Information
可視化による理解支援, 人工知能学会
Sciences.179 (11), 1639-1646 (2009)
技能の伝承支援研究会 (SIG-KST) pp.43-46 (2014)
[11]
Terai, H., & Miwa, K. (2013). A Chance Favours a
[24]
平岡 美那子, 大澤 幸生: 時系列テキストデー
Prepared Mind: Chance Discovery from Cognitive
タ可視化手法を用いた議論解析,
Psychology. Studies in Computational Intelligence, Vol.
全国大会 1A1-3 (2014)
423. In Ohsawa, Y. and Abe, A. (Eds.), Advances in
Chance
Discovery
(pp.
33-48).
Springer
Berlin
Heidelberg.
[12]
伊藤貴一、諏訪正樹、大澤幸生:属性を付属し
たテキスト可視化のための属性付き KeyGraph, 人
工知能学会全国大会 (2009)
[13]
Ohsawa, Y., Benson, N.E., and Yachida, M.,
KeyGraph: Automatic Indexing by Co-occurrence Graph
based on Building Construction Metaphor, IEEE Proc.
Advanced Digital Library Conf., pp.12-18 (1998)
[14]
Carrol, JM., Making Use:
Scenario-based design
of Human-computer Interactions, The MIT press
[15]
Eris,
O.
Effective
Inquiry
for
(2000)
Innovative
知識・技術・
第回人工知能学会