R と Tableau を使用する

プロダクトマネージャー エレーヌ チェン
R と Tableau を使用する
2
目次
R とは.............................................................................................................. 3
R を使用するメリット.................................................................................. 3
Tableau と R の統合の仕組み............................................................... 4
この機能の対象ユーザー....................................................................... 5
Tableau 8.1 で使用できる R の機能..................................................... 6
Tableau は予測解析を実行できるようになったのか..................... 7
Tableau 8.1 で使用できない R の機能................................................ 7
Tableau を R と共に使用するには........................................................ 8
R を学ぶその他のリソース..................................................................... 9
3
R とは
R とは、線形/非線形モデリング、統計的検定、時系列分析、分類、クラスタリングなどの、
高度な統計分析や予測分析を実行するための、人気の高い統計言語です。
R コンソールは主にコマンドラインインターフェイスを使用しますが、R プログラムの記述を
簡単にする GUI ツールが多くあり、ほとんどが無料でダウンロードして利用できます。R を
使用すると、ユーザーは変数、式、関数、グラフを作成して分析や予測を視覚化することが
▲
R は統計分析とグラフィックのた
めの無料のソフトウェア環境で
す。UNIX、Windows、Mac OS など
のさまざまなプラットフォームでコン
パイルし、実行することができます。
できます。
無料のオープンソースの言語であるため、R に元々組み込まれていない高度な統計関数を
定義する R 用の新しいパッケージ (拡張機能) がユーザーコミュニティによって継続的に作
成されています。これらのパッケージを R にダウンロードすれば、R の機能を拡張すること
ができます。また、これらのパッケージのほとんどが無料で開発、利用できます。こういった理
由から、R は非常に人気の高い言語となっており、徐々に機能性も向上し続けています。
R を使用するメリット
R は、膨大なデータセットの統計分析を行う際に非常に便利な機能を備えています。ま
た、無料で利用できることが、その成長の決定的な要因となっています。オープンソースで
あるため、常に新しい関数やパッケージが開発されており、最初は見つからなかった機能
を可能にするパッケージを検索したり、そういったパッケージを自分自身で作成したりする
こともできます。
ただし、R には制限事項もあります。柔軟性を維持するため、R はコマンドラインインターフ
ェイスを使用し、独自のプログラミング言語と構文を使用しています。多くの関数を利用す
るには、実際にある程度のコーディング能力が必要です。その他の専用の有料統計パッ
ケージの方がより使いやすく、プログラミングスキルを必要としないグラフィカルユーザー
インターフェイスを備えている場合も多くあります。¹ これらのソリューションは、R プログラミ
ング言語の習得に興味のないユーザーや、R で使用できるような高度な機能を必要とし
ないユーザーを対象としたものです。
¹ たとえば、Rattle はデータマイニング専用の GUI です。
4
Tableau と R の統合の仕組み
R エンジンを動的に呼び出して値を R に渡す新しい計算フィールドを作成することで、R
関数とモデルを Tableau で使用できるようになりました。Tableau のビジュアライゼーショ
ンエンジンで使用できるよう、結果は Tableau に返されます。
K-Means Clustering with R and Tableau
Sepal length
8
6
4
Species
I. setosa
2
I. versicolor
I. virginica
0
Sepal width
4
3
2
1
0
0
2
4
Petal length
6
0.0 0.5
1.0 1.5 2.0
Petal width
R を Tableau と連動させることで、K 平均法などの一般的な統計関数を利用できるようになります。
2.5
5
この機能の対象ユーザー
この機能は主に、既に R に精通しているユーザーを対象としたもので、R の初心者は対
象としていません。新しい関数の使用を希望する場合は、その機能を Tableau で利用す
る前にまず R の使用方法を学ぶ必要があります。
既に R に精通しているユーザーは、次のような面で統合を有益に利用できます。
•
Tableau データの統計解析を実行できる。
•
アクセス権のある R サーバーにインストールされている R パッケージや関数を利用
できる。
•
R で (面倒な) データを操作せずに、Tableau のすべてのビジュアライゼーション機能
利用して、さらに掘り下げた分析をしたり、データを把握することができる。
機能を使用するための前提条件:
•
必要なスクリプトや関数呼び出しを適切に記述するには、R 言語に精通している必
要があります。
•
Tableau Desktop や Tableau Server から R 関数にアクセスするには、R サーバー
へのアクセス権が必要です²
² Rserve は無料の R サーバーで、デスクトップやノートパソコンにローカルでインストールすること
ができます。Rserve の詳細については以下をご覧ください。
6
Tableau 8.1 で使用できる R の機能
Tableau Desktop:
特定の R モデルや関数を呼び出すために使用する、4 つの関数が新たに使用できるようにな
りました。関数は次のとおりです。
•
SCRIPT_REAL
•
SCRIPT_STR
•
SCRIPT_INT
•
SCRIPT_BOOL
これらの関数は、返す結果の種類のみが異なります (実数、文字列、整数、ブール)。
各関数に渡す引数には、R 言語スクリプトや関数呼び出しが含まれます。R には複数の引数を
渡すこともでき、これらの引数は Tableau 経由で動的に渡されます。たとえば、顧客ごとの売上
を viz 経由で渡すことができます。
Desktop を使用する場合、新しい関数を呼び出すには、Tableau がアクセスできる R サーバ
ー (Rserve³ 経由) が必要です。
Tableau Server:
R 関数呼び出しを行うワークブックが機能するには、Tableau Server が R サーバーと通信で
きる必要があります。通信を設定すると、R 計算の結果を取り込み中でも、他のユーザーとワー
クブックやビューを共有することができます。Tableau Server がアクセスできる R サーバーが
実行されてない場合は、ワークブックに正確な出力を表示することができません。
Tableau Online と Tableau Public:
現時点では、Tableau Online と Tableau Public は R をサポートしていないため、R 統計機
能をこれらのサービスで使用することはできません。
³ Rserve とは? Rserve を使用すると、R や R ライブラリへのリンクを初期化することなく、他のプログラムが
R の機能 (http://www.r-project.org を参照) を使用できるようになります。Rserve はリモート接続、認証、フ
ァイル転送をサポートしています。一般的には、他のアプリケーションで統計モデル、プロットなどの計算のた
めの R バックエンドを統合するのに使用されます。
7
Tableau は予測解析を実行できるようになったか
Tableau には、傾向や予測などの予測機能が既に組み込まれています。Tableau 8.1 で
は予測機能が向上しており、予測帯をレベル調整可能な確実性と共に表示したり、ペイン
ごとに複数のメジャーを予測したりすることができます。ユーザーは会計年度のカレンダー
付きの予測モデルを使用できます。さらに、新しい乗法モデルが追加されていますので、よ
り精度の高い予測が可能です。
R パッケージの中には高度な予測モデリング機能が備わったものもあり、Tableau ユー
ザーは Tableau 8.1 で新たに統合することでその機能を使用できます。
Tableau 8.1 で使用できない R の機能
Tableau は、前述の計算関数を通じてのみ R と統合できます。つまり、R の主要な機能の
中には Tableau 自体で直接使用することができないものもあります。
•
Tableau から R に直接データをエクスポートして、SCRIPT_* 関数以外で新しいモ
デルを実行することはできません。
•
R で作成されたビジュアライゼーションを Tableau に直接インポートすることはでき
ません。ただし、R ビジュアライゼーションのイメージ ファイルや R ビジュアライゼーシ
ョンへの URL であれば、Tableau ダッシュボードで使用できる場合があります。
•
データセットを R から Tableau にインポートすることはできません。計算フィールドで
SCRIPT_* 関数を使用した場合にのみ、R からデータを取得することができます。た
だし、R を使用してサポートされるデータソース (CSV など) 経由でデータをエクスポ
ートすれば、Tableau でデータを視覚化することができます。
8
Tableau を R と共に使用するには
R とその機能を既に熟知している場合は、R と Tableau 間の接続を確立するだけです。
以下は、オープンソースバージョンの R を使用して新たにインストールを行う場合の手順
です。Revolution Analytics などの他のパッケージを利用すると、別の手順を使用するこ
ともできます。
1. R をダウンロードしてインストールします。 R のダウンロードファイルや方法について
は、こちらをクリックしてください。
2. Rserve をダウンロードしてインストールします。接続する Tableau が新しいスクリプ
ト関数を使用できるように、Rserve をインストールする必要があります。R コンソール
に、次のコマンドを入力します:
install.packages(“Rserve”)
library(Rserve)
Rserve()
3. Tableau を R サーバーに接続します。Rserve をインストールしたら、Tableau Desktop
を開いて次の操作を行います。
a. [ヘルプ] メニューに移動し、[Manage R Connection] を選択します。
b. サーバー名に「Localhost」(または「127.0.0.1」)、ポートに「6311」と入力します。
c. すべて問題なく実行されることを確認するには、[Test Connection] をクリックします。正
常に接続できたことを表すメッセージが表示されます。[OK] をクリックして終了します。
4. Tableau で R スクリプトを使用します。これで、SCRIPT_* 関数を使用して R 関数
を呼び出す新しい計算フィールドを Tableau Desktop に作成できます。
9
Tableau について
Tableau Software はお客様がデータを視覚的に理解できるよう支援します。Tableau を利用すれば、情報
をすばやく分析、可視化し、共有することができます。Tableau を導入することで、オフィスでも外出先でもすば
やくデータ分析を行えるようになったお客様は既に 15,000 人を超え、ブログや Web サイトでのデータ共有
に Tableau Public を利用しているユーザーも数万人にのぼります。ぜひ無料トライアル版をダウンロードし
て、Tableau の使い勝手を直接ご確認ください。
www.tableausoftware.com/trial
R を学ぶためのその他のリソース
R を利用し、その機能を Tableau で活用するのに便利なその他のリソースも用意されて
います。
R について学ぶ
統計分析のための R プロジェクト
R に関するチュートリアル:統計への R の導入
Google 開発者による R の紹介
R トレーニング チュートリアル
Coursera:Data and Statistics Courses (データと統計コース)、Computing for Data Analysis
(データ分析のための計算) (2014 年 1 月)
書籍:Software for Data Analysis (データ分析のためのソフトウェア)
Stack Overflow Q&A (スタックオーバーフロー Q&A)
R スクリプトリポジトリ
R の活用法に関するブログ
Tableau と R (ブログ)
TableauLove: How to configure Tableau Server to use R (R を使用するための
Tableau Server の構成方法)
Tableau ブログ: Tableau 8.1 and R (Tableau 8.1 と R)
ジェニファー アンダーウッド: How to visually analyze R predictive models in Tableau
(Tableau で R 予測モデルを視覚的に分析する方法)
Data Plus Science:Geocoding addresses directly in Tableau 8.1 using integration with R
(R との統合を使用した Tableau 8.1 で直接行うジオコーディング処理)
Tableau および Tableau Software は Tableau Software, Inc. の商標です。その他の社名および製品名は各社の商
標です。