IT の進展と データベースの概念 1 1.1 情報システムの進展 RDBMS の浸透と IT 市場の発展は強く結び付いている。ホスト・コンピュータ全 盛の時代から,クライアント/サーバ,そして Web の時代へとコンピューティング・ パラダイムがシフトしていく過程で RDBMS が市場に幅広く浸透していったともい えるし,逆に,RDBMS の普及がコンピューティング環境の進展に大きく寄与したと いう見方も同時できる。コンピュータ・システムの用途という観点からも,事務処理 の生産性から,自動化,情報共有,そして情報活用や意思決定支援と,その活躍の場 を広げるコンピュータの存在の陰には,いつも RDBMS が追走していたといえる。 コンピュータの歴史をさかのぼると,その主要な用途はそもそも電子計算機と呼ば れたことで分かるように,当初は数値を演算することであった。その後,入出力装置, 記憶装置およびソフトウェアの進化により,数値ばかりでなく文字を取り扱えるよう になり,演算するだけでなく保存したり,保存された複数のデータを参照し加工した りできるようになっていった。さらにネットワークの進化により,それらは場所を越 えて共有されたり交換されたりすることにより,利用者の意思の疎通を助けたり,意 思決定を支援するような役割を果たすものへとその役割を広げていった。 そうしたコンピュータの利用技術の進展に呼応して,データを情報や知恵として活 用するための基盤として重要性を増している技術が DBMS である。生産性の向上を 目的として情報化された適用業務の多くは,財務・会計,人事管理,購買管理,販売 管理,顧客管理,在庫管理,生産管理など文字と数値からなるデータを保存し,必要 に応じて参照や変更を行うといった作業であり,まさに DBMS が得意とするアプリ ケーション分野で,こうしたビジネス用途のアプリケーションの大部分がデータベー ス・アプリケーションであるといっても過言ではない。 13 1. IT の進展とデータベースの概念 コンピュータ・システムがビジネス用途で一般的に使われるようになってから現在 に至る経営環境,経営課題,経営管理手法,経営管理システムおよびその他の IT 全 般における変遷を図 1.1 に示した。 1980年代以前 1990年代 経営環境 規模の経営 2000年代前半 消費の多様化 中国経済の躍進 M&A急増 冷戦終結 経営課題 BPR 多角化 敵対的M&A グループ経営 グループ再編 CSR 差別化 品質向上 SOX法 BRICs台頭 ベンチャー勃興 バブル崩壊 ブラックマンディ 大量消費 組織フラット化 環境経営 コスト低減 多様化 リストラクチャリング グローバル化 迅速性 経営管理 PPM TQC 原価管理 経営管理 システム その他IT全般 SIS EIS レポートを生成する ホスト・コンピュータ POS CIM FA OA 個別業務を支援する 適応力 選択と集中 ソフト・アライアンス キャッシュフロー経営 連結決算 シックスシグマ MIS 成果主義 ABC/ABM 管理会計 電算処理する 創造性 透明性 説明責任 コアコンピタンスの強化 生産性 2000年代後半 適応力の経営 スピードの経営 自動制御経営 バランス・スコアカード SEM CPM 制御できる経営を支援する 見える経営を支援する クライアント/サーバ CRM Web ERP SCM KM BI 電子メール データウェアハウス インターネット EC 業務の全体最適化 M&A:Merger and Acquisition SOX法:Sarbanes-Oxley Act BRICs:Brazil, Russia, India, China BPR:Business Process Reengineering CSR:Corporate Social Responsibility TQC:Total Quality Control PPM:Product Portfolio Management ABC:Activity Based Costing ABM:Activity Based Management MOT:Management of Technology MIS:Management Information System SIS:Strategic Information System EIS:Executive Information System SEM:Strategic Enterprise Management CPM:Corporate Performance Management MOT コックピット経営 RFID BPO BPM EAI コラボレーション SOA コンテンツ管理 ビジネスを強化する ビジネスに組込まれる POS:Point of Sales CIM:Computer Integrated Manufacturing FA:Factory Automation OA:Office Automation ERP:Enterprise Resource Planning SCM:Supply Chain Management CRM:Customer Relationship Management EC:Electronic Commerce KM:Knowledge Management BI:Business Intelligence EAI:Enterprise Application Integration SOA:Service Oriented Architecture BPM:Business Process Management RFID:Radio Frequency Identification BPO:Business Process Outsourcing 図 1.1 経営環境および経営課題の変遷と情報システムの進展(出典:ITR) 14 1.1 情報システムの進展 経営管理システムの変遷を見ると,1980 年以前の「電算処理をする」から,1990 年代前半にかけての「レポートを生成する」という時代において IT は,個別業務を 支援するという役割を担っていた。この時点までは,いわゆる○○管理システムと呼 ばれる業務アプリケーションを,DBMS をベースに個別に開発するという対応が主流 であったといえる。その後,1990 年代後半から,広範な業務分野を統合的に管理する ERP パッケージなどの登場により業務の全体最適化が指向され,経営管理システムは 「見える経営を支援する」ものへと進化していった。これに呼応してデータベースの 世界では,分析というキーワードが浮上し,CRM やデータウェアハウスの概念が注 目を集めるようになった。 21 世紀に入って,ビジネス環境の変化のスピードはますます速まり,グローバル化 と競争の激化の中で,さらに高度な経営の舵取りを企業に求めるようになってきた。 インターネットの普及と個人の情報武装化により社会環境全体が IT の支援を強く求 めるようになり,企業においては IT がビジネスを強化する役割を担うようになって いった。ビジネスデータは,より戦略的に活用されるようになり,ビジネス・インテ リジェンス(BI)を実現するツールが注目を集め,DBMS やデータウェアハウスに蓄積 されたデータを高度に分析し,長期的なトレンドを予測したり,異なる事象の相関関 係を見つけ出したり(データ・マイニング)することが可能となっていった。 2000 年代後半になると,ビジネスを取り巻く環境の変化はますます著しくなり,企 業経営には,変化に対する適応力が強く求められるようになる。IT は経営の舵取りを 強力にサポートするようになり,「制御できる経営を支援する」存在となる。制御で きる経営とは,IT による仕組みが,あらかじめ規定した一定のしきい値やビジネス ルールに従って,業務プロセスの進捗や成果をモニターし,問題が生じた場合や予測 かい り および計画と実績が乖離した場合に,いち早くアラートを発したり,自動的に診断や 対策のためのプログラムを実行したりすることができる状態を指している。 IT はビジネスに組み込まれ,業務プロセスと一体化してビジネスを推進するエンジ ンの一部となることが求められ,DBMS やデータウェアハウスに対するデータ要求に リアルタイム性が重視されるようになる。また,将来的には,定型的なデータだけで なく,E メール,コールセンターに寄せられる顧客の声のログ,Web コンテンツなど 非構造化データの管理や活用の重要性が高まり,DBMS とコンテンツ管理の融合が進 むと考えられる。 15 1. IT の進展とデータベースの概念 1.2 RDBMS の誕生 RDBMS に関する技術を学びたい読者の中には,歴史には興味がないという方もい るかもしれない。しかし,市場に影響を及ぼした製品や技術の影には必ず功労者の情 熱や努力があり,それを知ることは技術者としての喜びの 1 つではないだろうか。ま うじ す じょう た,技術の氏素 性 を知ることは,その技術の本質を理解する上で非常に重要といえる。 RDBMS の歴史をたどる上で,エドガー・F・コッド博士(2003 年 4 月に逝去)の功 績を抜きに語ることはできないが, まずは,RDBMS およびその考え方を示したリレー ショナル・モデル登場以前の歴史を紐解いてみよう。 世界初のコンピュータは,1946 年にペンシルベニア大学で開発された ENIAC だと されている。約 18,000 本の真空管を使い,総重量は 30 トンで,高さ 2.5 メートル, 奥行き 0.9 メートル,幅 24 メートルという巨大な装置であり,当初は,演算が主要な 役割であり,大砲の弾道計算などに使われたとされている。 一方,ENIAC の発表から 2 年後の 1948 年に,米 IBM はニューヨークの本社で, 真空管 12,500 本を使用し,長さ 37 メートル,ビルの 2 フロア分を占有する SSEC (Selective Sequence Electronic Calculator)を稼働させた。後に“RDBMS の父”と 呼ばれるコッド氏は,この SSEC のプログラマとして翌 1949 年に IBM に入社してい る。その後,同氏は,カナダの誘導ミサイルプロジェクトのためのコンピュータセン ターの設立(1953 年), 既存のコンピュータの性能を 100 倍にする STRETCH プロジェ クト(1955 年開始)への参画など,コンピュータ史上に残るプロジェクトを経験してい る。 その後,コッド氏は IBM の奨学制度を利用してミシガン大学の大学院で学び,1967 年にコンピュータサイエンスの博士号を取得している。この時,ミシガン大学では, 初期のノイマン型電子計算機の論理設計に携わったアーサー・バークス氏がコン ピュータ論理学やアルゴリズムを教えていた。 ちなみにノイマン型電子計算機とは,プログラムをデータとして記憶装置に格納し, これを順番に読み込んで実行するコンピュータ(ストアドプログラム方式,プログラム 蓄積方式)で,現在のコンピュータのほとんどがノイマン型である。1949 年にイギリ スで開発された「EDSAC」が世界初のノイマン型電子計算機と言われている。つま り,処理性能や保存容量は飛躍的に向上したが,プログラムをデータとして記憶装置 16 1.2 RDBMS の誕生 に格納し,これを順番に読み込んで実行するというコンピュータの基本的な仕組みは, 半世紀以上が経過しても変わっていないことを意味している。 さて,バークス氏は,前述した世界初のコンピュータである ENIAC を開発した 6 人の科学者の 1 人であり,世界初のノイマン型電子計算機の座を EDSAC に奪われた EDVAC の開発にも携わっていたが,もともとはド・モルガンの流れを汲む哲学者で あるチャールズ・S・パースに関する論文で博士号を取得している。パースの思想の 基本は,「生物の振る舞いは論理に基づいている」というものだった。後にコッド氏 が,リレーショナル・モデルにおいて使った和集合(union),関係の定義域(domain of relation),正規形式(normal form)などの用語は,パースが 19 世紀に論理学上の関係 を表すために使っていたものであることは興味深い。つまり,最先端の IT 技術も, 何世紀も前の論理学や哲学と決して無関係ではないということである。 話を RDBMS の誕生に戻そう。ミシガン大学大学院を終了したコッド氏は,IBM のサンノゼ研究所でデータマネジメントシステムの研究に取り掛かる。コンピュータ によるデータ管理は 1960 年代初頭から着手されており,1963 年に米 GE(ジェネラ ル・エレクトリック)社が発表した IDS が現在の DBMS の原型といえる。IDS は,後 にネットワーク型データモデルと呼ばれるデータモデルを実装したものであった。ま た 1968 年には, 階層型データモデルを実装した IMS が米 IBM から発表されている。 ネットワーク型データモデルや階層型データモデルは,データ(レコード)同士をポ インタで結び付ける考え方をとっていた。この頃は,プログラミングにおいても処理 のつながりについても,アドレスを指示するポインタの結び付きで記述するのが一般 的であり,データの取り扱いもそれと同様に考えるのは自然の流れといえよう。これ に対してコッド氏は,データを,表(テーブル)を構成する行(ロー)と列(カラム)で表 現すべきであると考えた。つまり,コッド氏は,データの関係をプログラミング手法 の観点でなく,論理学の視点で表現したことが画期的といえる。 その成果を,1969 年 8 月の IBM リサーチリポートに“Derivability, Redundancy, and Consistency of Relational Stored in Large Data Banks”という論文で発表し, 翌 1970 年 6 月に,その改訂版をコンピューティング・マシナリー学会(ACM)の学会 誌に“A Relational Model of Data for Large Shared Data Banks”と題した論文で発 表した。この時点では,データベースという言葉は使われていないが,これが大きな 注目を集め,その後リレーショナル・モデルに基づくデータ管理手法および管理シス テムに関する研究が盛んになっていった。 17 1. IT の進展とデータベースの概念 1.3 RDBMS 製品の歴史 1969 年および 1970 年のコッド氏によるリレーショナル・モデルの提唱を受けて, IBM のサンノゼ研究所は,1973 年に System R というプロジェクトを立ち上げた。 このプロジェクトでは,1974 年に SQL(Structured Query Language)の原型となっ た SEQUEL(Stored English Query Language),SQL(1977 年),クエリーコンパイ ラ(1979 年)などの成果が着々と生み出され,1981 年の IBM 最初の RDBMS 製品で ある SQL/DS の発表につながっている(図 1.2)。 RDMBS の製品化にはもう 2 つの大きな流れがある。その 1 つが,カリフォルニア 大学バークレイ校(UCB)のマイケル・ストーンブレイカー教授が 1973 年に開発した INGRES(Interactive Graphical Retrieval System)である。INGRES は 1980 年頃か ら,Relational Technology(RTI)社から提供される商用版 INGRES(筆者は 1985 年 頃,RTI 社から商用版 INGRES を輸入してビジネス・アプリケーションの開発に利 用していた)と University INGRES に枝分かれしていった。INGRES をベースに, Informix(1981 年),Sybase(1984 年)などの製品が次々と開発されていった。ちなに み,Microsoft 社の SQL Server は,同社が Sybase と提携して OS/2 向けに移植しよ うとしたもので,その後 Windows NT に移植された製品である。 一方,University INGRES は,ストーンブレイカー教授がオブジェクト指向デー タベースの成果を取り入れ,1985 年に INGRES の後継という意味で POSTGRES と 改名される。その後,ストーンブレイカー教授は,POSTGRES で蓄積した技術をも とにオブジェクト・リレーショナル・データベースを開発し Illustra と名付け,自ら 率いる Illustra Information Technologies 社から商用製品として発売した。Illustra 社は,その後 Infomix 社に買収され,さらに 2001 年に Informix 社が IBM に買収さ たど れるという運命を辿っている。しかし,UCB および POSTGRES を支持する開発者 達のコミュニティは POSTGRES をその後もサポートし,そこからオープンソース・ ソフトウェアの PostgreSQL が生まれている。 18 2000 年代 90年代 80年代 70年代 Oracle V2 Oracle 10g (2003) (2001) (1992) Oracle 7 Oracle 9i (1988) Oracle 6 (1997) (1985) Oracle 5 Oracle 8 (1984) Oracle 4 Oracleに社名変更 Oracle V3 (1983) (RSI社;現Oracle,1979) (IBM,1973∼4) Illustra INGRES (オープンソース,2004) (Microsoft, 1992) (IBM,2002) 図 1.2 主な RDBMS 製品の系譜(出典:ITR) (1984) SQLserver Sybase DB2 UDB V8 (IBM,2000) DB2 UDB V7 (CA,1996) (.org,1997) INGRES II PostgreSQL (1995) (UCB,1995) Postgres95 INGRES (RTI,1980) Informix UDO (IIT,1994) (UCB,1985) Postgres (UCB) (IBM,1997) Informix(1981) (UCB,1973) University INGRES INGRES DB2 UDB V5 (IBM,1983) DB2 (IBM,1981) SQL/DS System R コッド氏のリレーショナルモデル(1970) 1.3 RDBMS 製品の歴史 19 1. IT の進展とデータベースの概念 さて,INGRES と異なる商用 RDBMS におけるもう 1 つの大きな流れが Oracle で ある。Oracle 社の創始者であるラリー・エリソン氏は,アンペックス社で,CIA の資 金によりビデオテープを使ったデータ検索システムを開発するプロジェクト(このプ ロジェクトのコード名が Oracle であった)のプログラマであったが,1977 年にその時 の仲間と Software Development Laboratories(SDL)社を設立した。彼らは,System R の仕様をベースに RDBMS の開発に着手した。1979 年に社名を Relational Software (RSI)社に変更し,この時に商用の RDBMS 製品として Oracle V2 を世に 送り出している。Oracle という社名になったのは,Oracle V3 をリリースした 1983 年のことである。 このように,RDBMS は,コッド氏がリレーショナル・モデルを提唱してからさま ざま企業と人が機能を拡張しつつ発展させてきた歴史があるのである。 1.4 データベースとデータベース・アプリケーション データベースという言葉は,データを蓄積する基地という意味で 1960 年代から使 われ始めたと言われている(図 1.3)。データベースの概念が登場した背景には,情報 システムの役割における変遷が大きく関係している。そもそも情報システムの中核を なすコンピュータは,その語源である“Compute”からも分かるように「演算する」 道具であった。その後,演算するだけでなく,データを蓄積し,必要に応じてそれを 参照したり,加工したりすることでデータ処理の効率を向上したいという業務上の ニーズが,データベースという概念の登場とその普及を牽引したといえよう。 データベースとは,データを蓄積し,供給する“基地”である 社員番号 氏名 生年月日 住所 データは,検索や更新が しやすいように整理され 管理されて格納される。 図 1.3 データベースとは 20 1.4 データベースとデータベース・アプリケーション データベース管理システム(DBMS)によりデータが管理される以前は,データは データ・ファイルに格納され,データのデータ・ファイル上の物理的な位置,データ の形式や長さ,あるデータとデータの論理的な関係などは,すべてアプリケーション・ プログラムが管理しなければならず,アプリケーション・プログラムの開発と保守の 両方において,プログラマにとって大きな負担となっていた。つまり,データの形式 や長さを変更したり,新たなデータ項目を追加したりしようとすると,アプリケーショ ン・プログラムに大きな変更を加える必要があり,逆にアプリケーション・プログラ ムに変更を加えるたびに,正しいデータ処理がなされるように確認しなければならな かった。 データベースにより管理されるデータは,検索や更新といったデータ処理を行いや すいように整理され管理された状態で格納されることが前提となっている。整理され 管理された状態のデータとは,「非冗長性」「整合性」「妥当性」および「信頼性」 が確保されたデータを意味する(図 1.4)。 非冗長性 − 同じデータを重複して持たない 整合性 − 1つのデータの更新により,関連データを一括更新する 妥当性 − 不適当な値の入力を防止する 信頼性 − (複数ユーザーが利用する場合)アクセスを制御する (障害が発生した場合)データを復旧する 図 1.4 整理され,管理されたデータ また,データベースによりデータ管理されることの最も大きな意義の 1 つが,前述 したようなプログラマにとっての負担を軽減するために,データをアプリケーショ ン・プログラムから独立させるという点である。つまり,データを検索したり更新し たりする際に,ユーザーやアプリケーション開発者が,データの物理的な位置,属性, 長さなどを必ずしも意識する必要がないということである。 さて,データベースを利用したアプリケーションには,どのようなものがあるのだ ろうか。データベースのニーズの源泉である「データを蓄積し,必要に応じてそれら を参照したり,加工したりすることにより,データ処理の効率を向上させる」という 業務上の要求から考えると,データベース・アプリケーションの適用範囲は非常に広 いということが容易に想像されるだろう。つまり,人の頭の中や手作業で管理するこ 21 1. IT の進展とデータベースの概念 とが困難な量のデータが存在するところには,あまねくデータベースの必要性とデー タベース・アプリケーションの適用可能性があることを意味するのである。 例えば,個人レベルで名刺や住所録の管理を行うというものから,企業レベルの資 産管理,商品管理,顧客管理などといった業務システム,あるいは銀行の勘定系シス テムや地方自治体における住民データベースなどの業種特定のアプリケーションなど, 小規模なものから大規模なものまで多岐にわたる。 また,これまでデータベースによって取り扱われるデータは,形式や長さが決まっ た(すなわち構造化された)数値および文字が中心となっていたが,昨今では,文書, 画像,音声あるいは映像などの非構造化データまたはコンテンツを取り扱うことがで きるデータベースも登場している。 1.5 データウェアハウスとデータ分析 データベースの概念が投入されて以来,コンピュータ・システムは業務において発 生するさまざまなデータを管理する道具として利用されるようになった。企業の業務 アプリケーションの名称として,顧客管理システム,生産管理システム,販売管理シ ステムといったように,「○○管理システム」 というものが多いのはそのためである。 一方,昨今注目されるコンピュータ・システムのもう 1 つの利用方法がある。それ は,意思決定系システムと呼ばれるものであり,データウェアハウス(DWH)やビジ ネス・インテリジェンス(BI)というキーワードがその象徴となっている。BI は,デー タを管理するために利用するのではなく,データを分析し,そこから得た知見を実行 することを意図したものである。データウェアハウスは,BI を実行するためにデータ をさまざまな角度から分析しやすいように,企業内で日々やり取りされるデータを時 系列で蓄積したデータベースを指している。 データウェアハウスおよび BI の仕組みでは,データを分類,加工そして分析する ことにより,データを情報に,そして情報を知識や知恵に変えていくことを可能にす る。例えば,顧客 1 人ひとりの購買履歴を分析することにより,より精度の高いター ゲット・マーケティングを可能にしたり,商品の売れ筋や死に筋の状況を時系列で分 析することにより,効果的な商品投入計画や販売促進活動を行ったりといった適用事 例が見られる。 22 1.5 データウェアハウスとデータ分析 データウェアハウスおよび BI に加えて,CRM(カスタマー・リレーションシップ・ マネジメント,顧客との関係性の管理)というアプリケーション分野も注目される。こ れも,マーケティング,営業および顧客サポートといった活動を通してやり取りされ るデータを効果的に活用し,顧客満足度の向上や顧客の獲得に貢献することを意図し たシステムである。これらのシステムは,意思決定プロセスや営業活動のスピードを 高め,顧客指向のビジネスプロセスにより,意思決定のクオリティを高め,新規顧客 の獲得率や契約高を上げるという意味で,収益に主眼が置かれたシステムであるとい える。 このように,情報システムは,業務と意思決定のスピードと精度を高めることによ り,企業全体としてのコストの削減と,収益の向上を支える役割,そして,外部シグ ナル(顧客の嗜好,経済情勢,競合状況などの変化)をいち早く感知して環境変化に対 する適応力を強化する役割を果たすようになってきている。つまり,データベースに 格納されたビジネスデータをより戦略的に活用しようとする動きといえよう。 しかし,このようなシステムを導入したからといって,すべての問題が解決するわ けではない。ユーザーが望むデータをすべて最新の状態で保管する DWH を構築した とする。ユーザーがデータを照会すれば,いつでも欲しいデータを入手でき,ツール を利用してデータを自由に加工できる環境を,多大な投資によって実現したとしよう。 このようなデータ分析環境があれば,ビジネスは確実に成功するだろうか。おそらく 「成功する」と断言する人はいないだろう。 ユーザーが発行する 1 つの照会が, 企業の年間 100 億円の無駄を発見する可能性や, 売上げ増大につながるルールを発見する可能性は確かにある。しかし,完璧なシステ ムを提供するだけでは,このような発見を期待することには無理があろう。その理由 は簡単である。データを分析し活用する能力が必要だからである。これは,ユーザー 個人の能力だけを指しているわけではない。企業が組織として備えるべき能力こそが 重要なのである。今,企業に求められているのは,組織としてのデータ分析能力を高 めていくことではないだろうか。この能力を高めることで,データ分析環境がビジネ スの成功に寄与する場面は格段に増大し,継続的なビジネスの成長に加えて新たな商 機発見の確率も高まると考えられる。投資効果も,より確実なものとなるだろう。 企業のデータ分析能力には,いくつかのレベルがある。データ分析環境を利用して 何ができるか,という観点で能力を段階的に表すと図 1.5 のようになる。 23 1. IT の進展とデータベースの概念 高 何をすべきか分かる 企業のデータ分析能力 何が起こったか分かる 低 何が起こったかを,把握していない これから何が起こるかを,予測できる なぜ起こったか分かる (出典:ITR) 図 1.5 企業のデータ分析能力の成熟度 最も低いレベルは,自社のビジネス状況を数量的に把握できていない段階である。 例えば,キャンペーンのために顧客に来店を促す大量のメールを配信したが,その反 応を全く把握していない状態である。その次のレベルは,「メール配信後,来店客数・ 売上金額ともに 10%上昇」など,何が起こったか分かる段階である。さらに上位レベ ルでは,より詳細な分析が行われ,「特に 10 代の女性層で強い反応を示した」「10 代の女性の間で商品 XX への注目度が高い」といった反応の理由を明確化できる。さ らにデータ分析能力の高い企業であれば,強い反応がどのくらい継続するか,他の世 代へも拡大するか,といった予測を行うことができる。そして最終的には,具体的な アクションによってビジネスチャンスを拡大することができる企業が,最もデータ分 析能力の高い企業といえるだろう。 24
© Copyright 2024 Paperzz