資料ダウンロード

業務に機械学習を活用するための3ステップ
クラウド・テクノロジー事業統括
Cloud Platform事業推進室
ソリューション・アーキテクト部
クラウドアーキテクト
小川 幹雄
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
• 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明する
ものです。また、情報提供を唯一の目的とするものであり、いかなる契約
にも組み込むことはできません。以下の事項は、マテリアルやコード、機
能を提供することをコミットメント(確約)するものではないため、購買決定
を行う際の判断材料になさらないで下さい。オラクル製品に関して記載さ
れている機能の開発、リリースおよび時期については、弊社の裁量により
決定されます。
OracleとJavaは、Oracle Corporation 及びその子会社、関連会社の米国及びその他の国における登録商標です。
文中の社名、商品名等は各社の商標または登録商標である場合があります。
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
2
本日の流れ
• 機械学習の活用エリア
• Step1 チームづくりとプロトタイプ
• Step2 精度を上げるためのデータ整備
• Step3 新たなデータソース(空間情報+グラフ)
• 機械学習搭載アプリのデモンストレーション
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
3
そもそも機械学習ってなんだろう?
人工知能
機械学習
ディープラーニング
データマイニング
機械学習
ディープラーニング
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
4
機械学習の活用例
Sales &
Marketing
Finance
Industry 4.0
Operation &
Human Capital
営業ターゲット
クレジットリスク
ファクトリーIoT
タレント育成
クロスセル
不正送金
技術開発
メンタルケア
オムニチャネル
カスタマー360
製品開発
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
5
本格的な人材不足の時代に突入
マクロな市場課題
日本の人口減少
2050年で0.97億人まで減少
75歳以上が24.6%
労働人口の減少
グローバル人材の登用や
より効率的な経営が求められる
課題1.
優秀な人材の確保が
一層困難になる
世界の人口増加
2050年で90億人まで増加
食糧危機・エネルギー危機
国際競争の激化
課題2.
人材育成はより差別化
かつ「贔屓」のプログラムになる
南西アジア/ASEAN/中国等
アジアでは中間層・
富裕層人口の増加
急激に変化する市場に対応するために、
優秀な人材をいかに確保し適切なタイミ
ングで配置できるかが経営を左右する
課題3.
リテンションを意識して、
働きがいや成長を
実感させる必要がある
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
6
SNSバナー
対面営業
オンライン広告
展示会・セミナー
企業ページ
オフライン広告
リアルの世界
顧客との接点が対面からデジタルに変化
コールセンター
購買経験
メール
ネット情報
マスメディア
Webサイト・ECサイト
ネットの世界
・品揃え
・買いやすさ
・アフターサポート
ソーシャルネットワーク
お客様
顧客口コミ
店頭接客
モバイル・スマホ
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
7
接触回数の増加による膨大な未知のデータ
SNSバナー
オンライン広告
企業ページ
オフライン広告
購買経験
・品揃え
・買いやすさ
・アフターサポート
ネット情報
マスメディア
顧客口コミ
店頭接客
課題:分析対象データの種類が多すぎで分析が複雑すぎる
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
8
フェーズごとに必要なソリューション
ビジネス
目的
顧客の理解
見込客の育成
顧客の創出
見込客にパーソナライズ
したコミュニケーション
顧客の性質を把握・分析
案件化と成約
顧客定着
拡大
リード商談化率向上
新規顧客の増加
クッキーをベースに顧客
の関心に合わせた広告
ソリューション
予測分析による効率的な
ターゲティング
マーケティング活動を
デジタル化して可視化
LTVの増加
売上の向上
仕組
機械学習
DMP
キャンペーンシステム
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
営業管理、見積
顧客管理、
サポート
9
機械学習の進め方において大事なこと
データ
理解
ビジネス
理解
機械学習を進める上で重要なこと
「何をしたいか決めておく」
データ
準備
展開
データ
モデリング
• ビジネスの理解
• データの理解 が重要な要素となる
評価
※データ活用におけるPDCAサイクル (CRISP-DM)
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
10
機械学習サービスの提供形態
クラウドの階層
技術内容
主な提供企業
Marketing
Sales
ERP, HCM
Saba,
Adobe,
SAP
HCM Cloud,
ERP Cloud,
Service Cloud
プラットフォーム型
開発・実行環境
データベース
SAS, IBM,
Amazon,
Microsoft
Oracle Database,
Big Data Appliance
ライブラリ型
ライブラリ
フレームワーク
Google,
IBM,
Microsoft
ORE,
ORAAH
組み込み型
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
Oracle
11
Step1 チームづくりとプロトタイプ
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
12
Step1に移る前にもちろん可視化はできていますよね?
KISSの原則
Keep it short and simple
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
13
データサイエンティストは伝説のいきもの?
機械学習
IT
数学
ユニコーン
データ
加工
統計
業務
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
14
部門を跨いだチームでスキルをカバーする
人事部門
マーケティング部門
人事部門
分析担当
マーケティング部門
分析担当
分析部門
エンジニアリング
担当
分析担当
IT部門
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
業務
数学
IT
15
教科書に載っている機械学習手順
学習データ
新規データ
学習
モデル構築
予測
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
16
みなさんが直面する現実
法務レビュー
生データ
アウトソーシング
検証ガイドライン
タスク定義
サンプル
品質検証
能動学習
外部データ
ラベル付け
学習データ
特徴抽出
検証データ
モデル選択
テストデータ
新規データ
適用領域
学習
モデル構築
モデル解釈
評価
予測
ビジュアライズ
エラー分析
顧客フィードバック
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
17
プロトタイプのためのチェックシート
大項目
具体的な質問
ビジネスの目的 対象の課題とKPIは決まっていますか?
□
データソース
どのデータソースを使うか決まっていますか?
□
スキーマとテーブルの中身を理解していますか?
□
外部データを使う必要はありますか?
□
データの質をどのように整えるかイメージできていますか?
□
ビジネスの目的に対応したデータを持っていますか?
□
データの修正
データの結合
どの属性同士をつなげればよいか、手順が見えていますか? □
データの加工
分析用のデータに加工する手順が見えていますか?
□
インポート
対象のデータをインポートする仕組みは整っていますか?
□
結果・解釈
結果をビジネスの目的に合わせて解釈できますか?
□
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
18
例えば今回の目的はどれですか?
商品について知りたいこと
顧客について知りたいこと
どこでなにがどれくらい売れているか
推定、把握
この顧客はどんな商品を買ってくれているか
推定、把握
力を入れるべき商品はどの商品か
分類、抽出
優良な顧客、離反しかけている顧客は誰か
分類、抽出
この商品は将来どの程度売れるか
将来の予測
この商品は将来どの顧客が買ってくれるか
将来の予測
どの商品が一緒に買われているか
アソシエーション分析
この顧客クラスターになにを薦めればよいか
クラスタリング
新商品の評判はどうだったか
特徴検出
自社の顧客は性年代別、地域別にどんな人か
特徴検出
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
19
Oracle Data Miner(Oracle Database Cloud Service内機能)
• GUIで完結する機械学習開発プラットフォーム
– ドラッグ&ドロップで開発
– データ結合、モデル構築、テストをシンプルに設計
• 機械学習エンジン in Data Management Platform
– DMPの全てのデータから顧客セグメントを自動作成
– ターゲットリストをそのままDMP内に作成・保持
• 高いパフォーマンス
– データベースによる並列処理で高速分析を可能
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
20
Step2 精度を上げるためのデータ整備
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
21
作ったモデルに満足できない!
• モデル作成は泥臭い!
• Data Mungingや Data Wranglingと呼ぶ作業が必要
行列変換
行抽出
要約
結合
複数列に分解
列抽出
グルーピング
列追加
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
22
こんなデータを見つけ出すのが重要
製品ID
型番
売上
1
2
3
4
EF 300mm F2.8 L IS II USM
EF 24-70mm F3.5-5.6 L USM
AF-S DX NIKKOR 18-105 f/3.5-5.6G ED VR
AF-S DX Micro NIKKOR 40mm f/2.8G
35000
11000
20000
5000
キヤノン製
手振れ補正
は売上が高い?
製品ID
メーカー
焦点距離
開放F値
レンズ
手振れ補正
超音波モーター
売上
1
2
3
4
キヤノン
キヤノン
ニコン
ニコン
300
24-70
18-105
40
2.8
3.5-5.6
3.5-5.6
2.8
L
L
DX/ED
DX Micro
yes
no
yes
no
yes
yes
yes
yes
35000
11000
20000
5000
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
23
音声を分析するための下準備できていますか?
• 通話情報をテキストデータで保存
• 文章を構造化できる技術
商品Aを買ったが商品説明がわかりづらく、
できれば使い方を教えてほしい




9:30-午前中
商品A
説明
使い方
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
24
Oracle Big Data Preparation Cloud Service
データ利用者の準備作業を大幅に削減し、「質」の高いデータ分析/レポーティングに貢献
Runtime Metrics
Collect and ingest
(データを取り込む)
Enrich
(“質”を上げる)
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
Publish
(提供する)
25
機械学習で必ず気を付けるポイント1-過学習
• 汎化性能○
• 過学習
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
26
機械学習で必ず気を付けるポイント2-リーケージ
• リーケージによる予測精度100%モデル
19日時点での
情報
5日時点での
情報
12日時点での
情報
19日時点で辞めていない人は
12日時点では辞めていない!
5日時点でもやめていない!
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
27
機械学習で必ず気を付けるポイント2-リーケージ
• リーケージによる本番で使用できないモデルになるリスク
1
2
3
4
5
1
2
3
4
5
6
7
8
9
10
6
7
8
9
10
モデル
予測精度75%
6
7
8
9
10
6
7
8
9
10
モデル
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
予測精度60%
28
Step3 新たなデータソース(空間情報+グラフ)
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
29
データ量を増やすことによって、予測精度を上げる
100%
100%
“Big Data” と数百、数千のイン
Naïve Guess or
Random
Responders
プットから構成されたモデル
• 統計データ
• POSトランザクションデータ
• “非構造化データ”, テキスト &
コメント
• 位置情報
• 過去データと直近の行動
データ
• ウェブログデータ
• センサーデータ
Model with 20 variables
Model with 75 variables
Model with 250 variables
• etc.
0%
Population Size
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
30
まずは構造化することが重要
Data
Spatial & Graph Analytics Engine
Materialized Data
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
31
Spatialデータ分析
コロケーション探索
地域パターンの抽出・空間ビニング
緯度・経度
⇒ 住所番号, 住所
⇒ 特定地域
位置情報の相関分析
∑
クラスタリング
∑
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
32
Graphデータ分析
コミュニティの検出
ランキング
ネットワーク構造評価
経路探索
∑
∑
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
33
機械学習搭載アプリのデモンストレーション
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
34
デモンストレーションシナリオ
今から帰るよ!
今どこにいるの?
訪問先のオフィスだよ
どれくらいで帰ってこれるの?
最寄駅までは30分くらい
だけどコンビニ寄りたいんだ
それで何分後に
ご飯を温めればいいの?
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
35
ワンボタンソリューション!
Database Cloud Service
flic
IoT デバイス
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
36
デモンストレーション環境アーキテクチャ
Database Cloud Service
Spatial
Engine
REST API
API Call
Machine
Learning
Engine
APEX
flic
IoT Device
MAP Service
GPS
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
37
デモンストレーションで伝えたいポイント
flic
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
38
潜在していた課題とソリューション
• 入力側
課題
 退社場所と帰宅時間を伝えるのが手間
• 受け取り側
 適当な場所だとそこからの帰宅時間が読めない
• 入力側
 ワンボタンで帰宅場所と帰宅タイミングを送信
ソリューション
• 受け取り側
 どこから帰宅するのかを把握
 帰宅時間を予測して表示
 これまでの傾向を表示
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
39
プロトタイプのためのチェックシート
大項目
具体的な質問
ビジネスの目的 対象の課題とKPIは決まっていますか?
□
データソース
どのデータソースを使うか決まっていますか?
□
スキーマとテーブルの中身を理解していますか?
□
外部データを使う必要はありますか?
□
データの質をどのように整えるかイメージできていますか?
□
ビジネスの目的に対応したデータを持っていますか?
□
データの修正
データの結合
どの属性同士をつなげればよいか、手順が見えていますか? □
データの加工
分析用のデータに加工する手順が見えていますか?
□
インポート
対象のデータをインポートする仕組みは整っていますか?
□
結果・解釈
結果をビジネスの目的に合わせて解釈できますか?
□
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
40
Oracle Digitalは、オラクル製品の導入をご検討いただく際の総合窓口。
電話とインターネットによるダイレクトなコニュニケーションで、どんなお問い合わせにもすばやく対応します。
もちろん、無償。どんなことでも、ご相談ください。
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
41
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
42
Copyright © 2016 Oracle and/or its affiliates. All rights reserved. |
43