ビッグデータの定義について

ビッグデータの定義について
Some remarks on Definition of Big Data
石村 貞夫・石村 友二郎
Sadao ISHIMURA and Yujiro ISHIMURA
「鶴見大学紀要」第 51 号 第 4 部
人文・社会・自然科学編(平成 26 年 3 月)別刷
ビッグデータの定義について
ビッグデータの定義について
Some remarks on Definition of Big Data
石村 貞夫・石村 友二郎
Sadao ISHIMURA and Yujiro ISHIMURA
の利用目的の多様性にその特徴をみることができるの
1.序文
だが、まだ、「ビッグデータ」の定義は確定していな
「ビッグデータ」は、現在、IT産業のキーワードと
いようである。
なっており、新聞テレビなど、あらゆる分野で注目を
このような「big data」は、文字通り、大きなデー
集め始めている。
タのことなのだが、インターネットで「ビッグデー
リレーショナルデータベースのような構造化された
タ」を検索すると、その数は2650万件にものぼる。
データに対し、「ビッグデータ」は非構造化データと
そこで、このようなインターネット検索の中から、
いわれている。
「ビッグデータ」の定義をいくつか取り上げてみよ
この構造化されていないデータとは、顧客データ、
う。
売上高、証券取引のデータ、Eメール、インスタント
2.Yahoo 百科事典による定義
メッセージ、携帯メール、写真、音楽、動画、ブロ
グ、ソーシャルメディア、電子メール、センサーなど
定義 「ビッグデータ」とは、コンピュータや通信
のデータを意味している。
機器などの高機能なデジタル機器が仕事や暮らしに広
もちろん、医療における患者のカルテや診療報酬の
く利用されることにより、日々刻々と記録されている
レセプトなども構造化されていないデータといえるだ
さまざまなデータの巨大な集まりのこと。
ろう。
種類・大きさ 「ビッグデータ」には、種類や量な
したがって、「ビッグデータ」とは、情報の急激な
どになんらかの規定はなく、多くの種類と形式のデー
成長、可用性、活用法についての説明に広く使われる
タがある。
用語であり、「ビッグデータ」分析とは、大規模な非
性質 「ビッグデータ」には、データベースでファ
構造化データをいかに分析するかということになる。
イル管理されている構造化データとファイル管理のむ
データ分析用ソフトの SAS や SPSS では、独自の
ずかしい非構造的データとがある。
「ビッグデータ」分析方法を開発している。
3.ウィキペディアフリー百科事典による定義
「ビッグデータ」分析の目的は、社会・経済の問題
解決や、業務の付加価値向上や支援にあり、例えば、
定義 「ビッグデータ」 (英: big data)とは、市販
NHKのある番組によると、医療の分野では、どういっ
されているデータベース管理ツールや従来のデータ処
た治療をすれば最適な効果が上がるかという費用対効
理アプリケーションで処理することが困難なほど巨大
果が「ビッグデータ」分析により可視化され、これま
で複雑なデータ集合の集積物を表す用語である。
でブラックボックスだった医療のムダがあぶり出され
性質 「ビッグデータ」は、通常、収集、取捨選
たという報告もある。
択、管理、および許容される時間内にデータを処理す
さらに、医療に関する「ビッグデータ」を積極的に
るために一般的に使用されるソフトウェアツールの能
活用しているスウェーデンでは、高齢社会に備えて社
力を超えたサイズのデータ集合を含んでいる。
会保障情報も統合し、リウマチでは高い治療法を選択
4.知恵蔵2013 による定義
しても、患者が早期に社会復帰できれば安く済むな
ど、多くの治療項目を「ビッグデータ」で解析して、
定義 「ビッグデータ」とは、インターネットの普
高齢化対策が進められている。
及や、コンピューターの処理速度の向上などに伴い生
「ビッグデータ」には、今までのデータベースソフ
成される、大容量のデジタルデータを指す。
トが分析できる能力を超えたサイズのデータを意味す
例 ブログ、動画サイト、Facebook、Twitter、
る場合もあり、また、データの種類の多様性とデータ
ソーシャルネットワーキングサービス、パソコンやス
69
ビッグデータの定義について
マートフォンなどの文字、音声、写真、動画などのデ
使用例 「ビッグデータ」という言葉は、企業向け
ジタルデータ。
情報システムメーカーのマーケティング用語として多
大きさ コンピュータには、利用状況や通信記録な
用されている。
どのログと呼ばれるデータが日々生成されており、イ
大きさ・性質 「ビッグデータ」は単に量が多いだ
ンターネットにつながる様々なコンピュータから生み
けでなく、様々な種類・形式が含まれる非構造化デー
出される「ビッグデータ」は、合計すると数百テラバ
タ・非定型的データであり、さらに、時間を追って膨
イト以上とされている。
大に生成・記録される時系列性・リアルタイム性のあ
性質 「ビッグデータ」は、単に大容量であるだけ
るようなものを指すことが多い。
でなく、非定型でかつリアルタイム性が高い。
将来性 今までは管理しきれないため見過ごされて
比較 従来のデータベース管理システムでは、デー
きた「ビッグデータ」を記録・保管して即座に解析す
タを定型化して蓄積し、その後で処理分析するため、
ることにより、ビジネスや社会に有用な知見を得た
相反する性質を持つ「ビッグデータ」を扱うことは困
り、これまでにないような新たな仕組みやシステムを
難とされていた。
産み出す可能性が高まるとされている。
ソフト 近年、「ビッグデータ」を高速かつ簡単に
7.A社による定義
分析できる技術が登場し、「ビッグデータ」を活用す
れば、これまで予想できなかった新たなパターンや
定義 「ビッグデータ」とは、インターネットの普
ルールを発見できることが明らかとなった。
及とIT技術の進化によって生まれた大容量かつ多様な
活用例 アマゾンや楽天などのオンラインショップ
データのこと。
では、購買履歴やサイト内のアクセス情報などの
特性 「ビッグデータ」の特性は量、更新速度、
「ビッグデータ」を基に、商品を購入する際に、他の
データの種類に表れる。
おすすめ商品を表示している。
注意点 大きなデータがすべて「ビッグデータ」で
活用例 ソフトバンクでは、検索サイト「ヤフー」
はなく、「ビッグデータ」とこれまでのデータとの違
から得られる「ビッグデータ」を積極的に利用して、
いは扱うデータの種類にある。
他社から乗り換える可能性の高そうなユーザーを絞り
8.B社による定義
込み、該当するユーザーにのみ乗換案内キャンペーン
のバナー広告を表示させている。
定義 「ビッグデータ」とは、今まで集められな
活用例 「ビッグデータ」には、健康情報や位置情
かったデータや集めても活用しきれていなかった大量
報、気象情報など、様々な分野で活用できるデータが
のデータのこと。
含まれているため、新たな市場の創出が期待される。
重要性 実社会における人の活動やモノの動きから
生まれるデータの価値が重要であり、したがって、
5.デジタル大辞泉による定義
「ビッグデータ」から新たな価値を導き出すことが最
定義 「ビッグデータ」とは、膨大かつ多様で複雑
も重要である。
なデータのこと。
違い 量の規模の違い。種類の多様性の違い。リア
例 スマートホンを通じて個人が発する情報、コン
ルタイム処理の違い。
ビニエンスストアの購買情報、カーナビゲーションシ
9.C社による定義
ステムの走行記録、医療機関の電子カルテなど。
特徴 「ビッグデータ」は、単に膨大なだけではな
定義 2.5エクサバイトの大量 データを総じて
く、非定形でリアルタイムに増加・変化するという特
「ビッグデータ」と呼ぶ。
徴を持ち合わせている。
大きさ 「ビッグデータ」の容量は、数テラバイト
活用例 「ビッグデータ」を扱う新たな手法の開発
から数ペタバイト。
により、2010年前後から、産業・学術・行政・防災な
種類 「ビッグデータ」は、構造化データだけでな
どさまざまな分野で利活用が進み、意思決定や将来予
く、テキスト、音声、ビデオ、クリックストリーム、
測、事象分析が行われている。
ログファイル等のさまざまな種類の非構造化データも
含まれる。
6.IT用語辞典による定義
例 ICタグなどのセンサー、ソーシャルメディアの
定義 「ビッグデータ」とは、従来のデータベース
投稿、オンライン購入の処理レコード、 携帯電話の
管理システムなどでは記録や保管、解析が難しいよう
GPS信号、インターネット上に保存されたデジタル写
な巨大なデータ群のこと。
真、ビデオなど。
70
ビッグデータの定義について
7.ビッグデータ利活用 富士通
10.ビッグデータの分析ソフト
8.ビッグデータ 伊藤忠テクノソリューションズ
「ビッグデータ」の分析用ソフトとしては、I B M
9.IBM スマートなソフトウェア活用
SPSS Modelerがよく利用されている。
10.NECのビッグデータソリューション IBM SPSS Modeler は、迅速かつ直感的に予測モデ
11.Yahoo!百科事典
ルを作成できるように考えられた、プログラミング不
12.リレーショナルデータベース教科書 [改訂新版] 斉藤孝 著
要のデータ・マイニング・ワークベンチである。デー
2008/12 ソフト・リサーチ・センター
タ・マイニング手法を使えば、結果をモデル化し、結
13.リレーショナルデータベース 上向井照彦 松田稔 著
果に影響を与える要因を理解することができる。
2004/06 日刊工業新聞社
IBM SPSS Modeler は、IBM SPSS Modeler
14.やさしい情報検索とリレーショナル・データベース 田中
Premium および IBM SPSS Modeler Professional の 2
功 著 立花厚子 藤田裕 著 2004/05 培風館
つのエディションで使用できる。
15.リレーショナルデータベース入門 [新訂版] 増永良文 著 IBM SPSS Modeler の特徴 2003/01 サイエンス社
1.データ・マイニングを迅速かつ容易にし、データす
16.リレーショナルデータベースの基礎 増永良文 著 1990
べてを使用してより優れた意思決定を行うことができ
オーム社
る。
17.ビッグデータの正体 ビクター・マイヤー=ショーンベル
2.プログラミング不要の強力な予測モデルを作成でき
ガー 他 著 斎藤栄一郎 訳 2013/05 講談社 る。
18.ビッグデータの覇者たち 海部美知 著 2013/04 講談社
3.直感的なグラフィカル・インターフェースで作業が
19.ビッグデータ時代のマーケティング 佐藤忠彦 樋口知之
できる。
著 2013/01 講談社
4.ビジネス・ユーザーが直接データ・マイニングを行
20.ビッグデータがビジネスを変える 稲田修一 著 2012/12
えるので、アナリストの生産性が向上する。
KADOKAWA
5.モデル作成を自動化し、問題解決のための最良の手
21.サービス工学の技術 本村陽一 竹中毅 石垣司 編著 法を識別できる。
2012/11 東京電機大学出版局
6.Modeler Premium は、完全に統合されたテキスト
22.ビッグデータの衝撃 城田真琴 著 2012/07 東洋経済新報
分析ワークベンチを備えており、文書、電子メール、
社
ブログ、RSS フィードなどのテキスト分析ができる。
23.ビッグデータ革命 野村総合研究所 著 2012/03 7.Modeler Premium には、ID を解決するためのエン
KADOKAWA
ティティー分析と、個人およびグループの社会的行動
を表示するソーシャルネットワーク分析が含まれてい
る。
ビッグデータの定義
8.IBM および IBM 以外のデータベースで使用でき、
Some remarks on Definition of Big Data
モデルの配置およびスコアリングを高速かつ効率的に
実現する。
歯学部 准教授 石村貞夫
9.他の IBM SPSS ソフトウェア製品と統合して、切
早稲田大学大学院 基幹理工学研究科 応用数学科
れ目のない分析ができる。
石村友二郎
10.SPSS Modeler Professionalにより、予測インテリ
ジェンスを使用して、より優れた決定が可能となる。
参考文献
1.ビッグデータ Wikipedia
2.ビッグデータとは 知恵蔵2013
3.ビッグデータとは IT用語辞典
4.ビッグデータとは デジタル大辞泉
5.ビッグデータとは何か 総務省
6.ビッグデータへの道 日立
71
72