NeuralWorks Predict 試用版 概略使用説明書

NeuralWorks Predict 試用版 概略使用説明書
SET ソフトウェア株式会社
NeuralWorks Predict について
「NeuralWorks Predict」は、ニューラルネットワークの知識がなくても容易に使いこなせ
る画期的な分析ツールです。Excel のアドインとして組み込まれ、データの準備から結果の
出力やグラフ化が簡単に行えます。NeuralWorks Predict をインストールすると、Excel
のメニューバーに「Predict」メニューが表示されます。
「Excel でデータを準備」→「Predict
で分析」→「Excel で加工・可視化・分析」→「Predict で分析」といったサイクルを迅速
にまわすことができ、双方の特長を最大限に活用して効率的にデータマイニングを行うこ
とが可能です。
SET ソフトウェア株式会社
1 / 14
NeuralWorks Predict 使用手順
以下に使用手順を示します。
1.データを準備する
Excel にてデータを作成します (CSV 形式、カンマ区切りなどのテキスト形式も可能です)。
(例:ダイレクトメールのレスポンスデータ)
SET ソフトウェア株式会社
2 / 14
2.ニューラルネットワークモデルを作成する
2-1:メニュー「Predict」−「新規」を選択します。
2-2:モデルの種類を選択します。
■ 「直前のモデルからデータ範囲を行う」チェックは新規作成の場合、OFFにしま
す。
■ 「モデル構築ウィザード」チェックはONにします。OFFにすると、
「モデル構築
画面(ステップ6/6)
」へ遷移します。
■ 「次へ」をクリックすると確認画面が表示されます。
SET ソフトウェア株式会社
3 / 14
2-3:モデル構築画面(ステップ1/6)を入力します。
■ 「モデル名」を入力します。
■ 「モデル・タイプ」は「図3−1
新しいモデルの指定」で指定されたタイプが表
示されます。
■ 「モデル名をワークシートに適用」をチェックするとエクセルのワークシート名が
モデル名になります。
■ 「モデル名をワークブックに適用」をチェックするとエクセルのブック名がモデル
名になります。
■「モデルの記述」に入力します(125 文字以内)
。
■「入出力変数の名前」をコメントの通り指定します(ここでは$B$1 となる)。
■「入出力フィールドの名前」を入力する。特に指定がなければデフォルト値でよい。
■「次へ」をクリックします。
SET ソフトウェア株式会社
4 / 14
2-4:モデル構築画面(ステップ2/6)を入力します。
■ 「最初の入力データ・レコード」を指定します(ここでは、$B$2:$F$2)。
■ 「2番目の入力データ・レコード」を指定します(ここでは、$B$3:$F$3)。
■ 「すべての入力データ・レコード」を指定します(ここでは、$B$2: $F$211)。
■ 「次へ」をクリックします。
SET ソフトウェア株式会社
5 / 14
2-5:モデル構築画面(ステップ3/6)を入力します。
■「最初の出力データ・レコードセル」に一番目の出力データを入力します。実測値
でデータある「〇」(ここでは、$G$2)が対象となります。
■「次へ」をクリックします。
SET ソフトウェア株式会社
6 / 14
2-6:モデル構築画面(ステップ4/6)を入力します。
■「雑音のレベル」で雑音のレベルを選択します。ここではデフォルトの「多少の雑
音データ」を選びます(株式市場問題などでは「ひどい雑音データ」、数式から作成
されたデータでは「クリーンなデータ」を選びます)
。
■「データの変換レベル」でデフォルトの「一般的なデータ変換」を選択します。
SET ソフトウェア株式会社
7 / 14
2-7:モデル構築画面(ステップ5/6)を入力します
■「変数選択のレベル」を指定します。ここではデフォルトの「包括的な変数選択」
を選択します。
■「最適化のレベル」を指定します。ここではデフォルトの「包括的なネットワーク
検索」を選択します。
2-8:モデル構築画面(ステップ6/6)を入力します。
SET ソフトウェア株式会社
8 / 14
■ 入力内容を確認し、「学習」ボタンをクリックします。
2-9:完了画面が表示されます。ここでニューラルネットワークモデルが作成されます。
SET ソフトウェア株式会社
9 / 14
3. 作成したモデルを使って予測する
前の作業によりネットワークモデルが完成されました。このモデルを使って、予測を行
ってみましょう。
3-1:メニュー「Predict」−「実行」をクリックします。
3-2:次のダイアログボックスで、予測に使用する入力/出力データのセル範囲を設定しま
す。ここではすべての入力データに対する予測値を求めてみましょう。入力のセル範
囲(B2:F211)/出力のセル範囲(H2)を指定して、「実行」をクリックします。
SET ソフトウェア株式会社
10 / 14
3-3:予測値が表示されました。この画面上のデータに対しては、すべて正しく判別されて
いることがわかります。
実測値
予測値
個別データの判別状況は画面をスクロールすれば見られますが、トータルとしてのモデル
能を知るためには、Predict の Test コマンドを利用します。ではこの機能を使ってモデル
の性能に関するレポートを出力してみましょう。
SET ソフトウェア株式会社
11 / 14
4.性能レポートを出力する
Test コマンドを実行してワークシート上にモデルの性能レポートを出力しましょう。
4-1:メニュー「Predict」−「テスト」をクリックします。
4-2:「モデルをテスト」ダイアログボックスで、それぞれの区分を指定して、
「OK」をク
リックします。
■ 「出力結果」を表示するワークシート上のセル範囲の左上端セルを指定します。セ
ル J2 を設定します。
SET ソフトウェア株式会社
12 / 14
5.性能レポートを確認する
表2が Test 実行結果の出力です。
5-1:第 1 行の Accuracy は正判別率で、正判別件数/全件数で計算されます。当然1に近
いほど良い値です。Rel.Entropy はモデルの「あてはまり具合」を表します。0に近
いほどモデルの入力データへのあてはまり具合の良いことを示します。Total はトー
タルのデータ件数です。
5-2:また、J 列の All、Train、Test はデータ区分を表し、Train は学習用、Test はテスト
用のデータセットで、All は Train と Test のデータセットを合わせたものです。Train
と Test のデータは、ランダムに全体の70%と30%(デフォルト)の割合で選ば
れます。
5-3:All の行を見ると、Accuracy
0.8285714、Rel.Entropy 0.1399396、Total
210 と
なっています。これは、正判別率が 82.86%(210 件中 146 件)、Rel.Entropy は比較
的小さい値になっており、あてはまり具合がよいことを表しています。
5-4:Train と Test でも、ほぼ同じ傾向が見られます。
表2
性能レポート
6.新しいデータに対する予測を行う
下図・No.211∼213 の 3 人の新会員が加入しました。この 3 人についてダイレクトメー
ルのレスポンスを予測しましょう。
6-1:前に登録した210件のデータに加えて、3人のデータを追加します。
6-2:メニュー「Predict」−「実行」をクリックします。
SET ソフトウェア株式会社
13 / 14
6-3:「モデルを実行」ダイアログボックスにて設定を行います。
■「入力データの範囲」を指定(ここでは B212:F214)します。
■「モデル出力の範囲」を指定(ここでは H212)します。
■「実行」をクリックします。
6-4:新しく追加されたデータに対する予測値が出力されました。
SET ソフトウェア株式会社
14 / 14