インターネット掲示板のテキスト情報と株式市場

平成 27 年度
修士論文
インターネット掲示板のテキスト
情報と株式市場
一橋大学経済学研究科
学籍番号 EM151010
長山博一
2016 年 1 月 18 日
概要
本稿では、インターネット掲示板 textream の個別株式に関する書き込みから測定した投資家心理と、株
式指標 (日次リターン、日次出来高) との関係を検証した。検証の結果、投資家心理が高まると同時点の
リターンや出来高が高くなっていること、その傾向は時価総額が低い銘柄群について顕著であること、を
確認した。さらに、決算前に掲示板の活動が活発な場合、時価総額が低い銘柄群における決算後の異常リ
ターンが低くなる傾向にあること、を明らかにした。
目次
第 1 章はじめに
4
第 2 章先行研究と仮説の設定
6
第 3 章テキスト分類手法
8
第 4 章データ
10
第 5 章実証分析
5.1
テキスト分類 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
12
5.2
5.3
Comtemporary regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
イベントスタディ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
15
第 6 章終わりに
6.1
結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
20
6.2
今後の課題
20
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
参考文献
20
付録 A 図表
23
付録 B その他: 品種の種類 69 個
32
1
図目次
A.1 textream の投稿データ (例: 日本におけるソニーの掲示板) . . . . . . . . . .
23
A.2 textream の投稿データ (時系列) . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.3 textream の投稿データ (曜日別) . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
24
2
表目次
A.1 insample accuracy(C=Buy, Hold or Sell) . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
A.2 out of sample accuracy(3-fold cross validation, C=Buy, Hold or Sell) . . . . . . . . . . .
A.3 out of sample accuracy(4-fold cross validation, C=Buy, Hold or Sell) . . . . . . . . . . .
25
25
A.4 insample accuracy(C=Buy or Sell) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.5 out of sample accuracy(3-fold cross validation, C=Buy or Sell) . . . . . . . . . . . . . .
A.6 out of sample accuracy(4-fold cross validation, C=Buy or Sell) . . . . . . . . . . . . . .
25
26
26
A.7 パネル回帰分析 (具体例): 結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.8 使用データ (基本統計量: Large) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.9 使用データ (基本統計量: Mid) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
27
27
A.10 使用データ (基本統計量: Small) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.11 変数間の相関係数 (Large) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
28
A.12 変数間の相関係数 (Mid) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.13 変数間の相関係数 (Small) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.14 パネル回帰分析 (リターン): 結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
28
29
A.15 パネル回帰分析 (出来高): 結果 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.16 イベントスタディ結果 (強気比率) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
30
A.17 イベントスタディ結果 (投稿数) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
3
第 1 章はじめに
今日、インターネット上で金融市場に関するあらゆる情報を容易に手に入れることが可能となっている。
その中でも SNS(ソーシャルネットワーキングサービス) を通じた情報の収集が活発化している。SNS と
は、インターネットを通じて日記やメッセージなどにより他人との交流することを目的としたサービスの
総称である。日本においては、1996 年から 2001 年度にかけて行われた、金融ビックバンと呼ばれる大規
模な金融の規制緩和 (株式売買委託手数料の自由化で手数料率が自由化前の 1/7 程に減少、インターネット
証券会社の新規参入が認められる、など) を通じて、個人が株式などの金融商品の取引に参加しやすい環
境ができる中で、一般に機関投資家より情報収集能力の劣る個人投資家が SNS を利用したリアルタイムの
情報収集をしながら株取引等を行うようになった。例えば、経済指標の速報値やその他重要な速報ニュー
ス、あるいは特定の株式銘柄に関する情報、他の投資家の考え方、などを見て売買の際に生かしている。
近年では、SNS による書き込みで風説の流布や相場操縦を行うことで不当に利益を上げて逮捕される事例
や、特定の SNS への投稿内容に反応して株式の個別銘柄や株価指数先物などの金融商品を売買するアル
ゴリズム取引、なども見られるようになっている。
また、自然言語処理という SNS への投稿のようなテキストデータをコンピュータに処理させる一連の
技術が発達している。例えば、機械学習 (人間の学習能力と同様の機能をコンピュータで実現しようとす
る技術・手法) のような統計学的な手法も併せて応用することで、自動要約の作成、機械翻訳、質問応答
システムの作成、文書の意味解析といったことが、人の手を介さずにコンピュータ上だけでできるように
なってきており、コンピュータによる計算能力の飛躍的上昇も相まって、インターネット上の大規模なテ
キストデータを解析・利用することが可能となりつつある。
このような環境の中で、SNS への投稿が株式市場に与える影響を検証するというのが本稿の目的である。
日本における金融市場に関する情報を入手できる SNS は、主に、2 ちゃんねる、textream、Twitter が
ある。2 ちゃんねるとは、1999 年 5 月に開設された日本最大のインターネット上の電子掲示板サイトで
ある。それぞれの掲示板は、「カテゴリ」と呼ぶ大きな分野単位で区切られており、その中で分野ごとに
「板」と呼ばれるジャンルに分けられていて、各板には、その分野に属する話題ごとに細かく分けられた
スレッドが存在する。そのスレッドに匿名の人物がコメントを書き込むシステムとなっている。株式に関
する情報は、政治経済カテゴリの、市況実況 1 板（個別銘柄・セクター・国内市況の実況、暴騰暴落等を
書き込む）、市況実況 2 板（為替、番組、海外市況の実況等を書きこむ）、株式板（相場談義、証券会社、
質問相談等を書き込む）、投資一般板（投資をテーマにしたネタ・雑談・投資手法・サークル等を書き込
む）のスレッドに主に書き込まれる。この中で市況実況 1 板にリアルタイムで載せられるコメントを多く
の個人投資家 (特に専業個人投資家) は参考にしている。ただし、近年、2 ちゃんねるの市況実況 1 板は後
述の Twitter の出現によりユーザーが移転している。
一方、textream とは、ヤフー株式会社の運営する電子掲示板サイトである。1998 年に 7 月に Yahoo!掲示
板としてサービスを開始し、2013 年 3 月にスマートフォンにも対応した後継サービスとしてリニューアル
された掲示板が textream となっている。2 ちゃんねると同様に様々な分野の話題を書き込むスレッドがあ
る中で、投資に関する情報を書き込むスレッドが存在している。2 ちゃんねるとの違いは、日本最大のウェ
ブサービスにおける掲示板であること、Yahoo! Japan の ID が必要であること、などがあるが、本稿の事
情において最も重要な違いは、2 ちゃんねるにおいてはスレッドをユーザー自身が作成するが、textream
における株式投資に関するファイナンス掲示板のスレッドはユーザーが作成できず (ただし textream 内の
ファイナンス掲示板といった一部のカテゴリ以外はスレッドを作成できる)、元々スレッドが与えられてい
4
る、という点である。textream におけるファイナンス掲示板は、日本の上場している個別株式についての
スレッドが運営側によって全て予め作成されており、市場全体の話題に関しては「日経平均株価」という
スレッドなどに書き込まれる。したがって例えば、2 ちゃんねるにおいては、人気のない銘柄に関しては
スレッドが存在しなかったり、逆に人気のある銘柄はスレッドが乱立しているなどの事情が存在するので、
本稿で行うような包括的な掲示板のテキストデータを用いた分析を行う際には利用しにくくなっている。
最後に Twitter とは、2006 年 7 月開始された「ツイート」と称される 140 文字以内の短文の投稿を共有
する web サービスである。Twitter には、2 ちゃんねるや textream と異なり、「カテゴリ」「板」「スレッ
ド」といったものは存在せず、特定の人物 (アカウント) による投稿 (ツイート) そのものが実質スレッドの
役割を果たしており、フォローする (特定のアカウントの投稿を見れるように設定する) ことにより、複数
のアカウントのツイートをリアルタイムで見ることができる。例えば、日本経済新聞電子版などのニュー
スの更新内容を投稿するアカウントと、インターネット上でカリスマ的扱いをされている個人投資家の複
数のアカウントのツイートだけを確認できるように設定する (フォローする) ことで、金融市場全体の動向
や株式における個別銘柄に関する情報を得ることができる。Twitter では、2 ちゃんねるや textream と異
なり特定のアカウントのみの投稿を見ることができるので、投稿情報の質が高まることや、リツイート機
能 (ある他のアカウントのツイートをフォローしている人たちに拡散する機能) を通じて、より迅速に重要
な情報が手に入りやすくなることから、2 ちゃんねるや textream といった掲示板からユーザーが Twitter
に移っていると考えられる。しかし、Twitter には、前述のとおりスレッドが存在せず、自らのコメント
がスレッドに反映されることもないというのに加え、特に株式市場においては、話題がある特定の個別株
式銘柄についてと決められていない環境で個別株式銘柄についてのツイートを行うと、相場操縦に当たる
との批判が比較的起きやすいこともあり、2 ちゃんねるや textream にも一定の需要が存在している。ま
た、スレッドが存在しないので、どの株式銘柄についての投稿であるのかを判別することが困難なので分
析に使用するのには向いていない。
そこで、本稿では、日本におけるインターネットの株式掲示板 textream の投稿データのみを用いて、そ
のテキストデータと株式指標の関係についての実証分析を行った。より具体的には、textream に投稿され
たメッセージを、機械学習のテクニックを用いて「強気」「中立」「弱気」のいずれかに分類し、その分類
に基づいた掲示板指標を作成することで、それらと株式指標（リターン、出来高）との関係性を明らかに
することを目的とする。
本稿の構成は以下の通りである。第 2 節では、先行研究を概観し仮説の設定を行う。第 3 節では、テキ
ストの分類手法について述べる。第 4 節では、使用したデータの内容・出処について示す。第 5 節では、
分析方法、データに関する記述統計、分析結果および結果の考察を行う。第 6 節では、前節までの議論を
踏まえての本稿の総括を行う。
5
第 2 章先行研究と仮説の設定
インターネット掲示板に関連した最初の研究に、Wysocki(1999) がある。Wysocki(1999) は、米国の
Yahoo!掲示板に投稿された 1997 年における 3478 銘柄のメッセージのデータを用い、投稿数についてのク
ロスセクションと時系列の決定要因を回帰分析によって調べている。結果として、投稿数が、ROE ある
いはリターンが平均から大きく乖離している場合、時価総額、ボラティリティ、個人投資家比率等が高い
場合、に多くなり、配当額、NYSE の上場ダミー等と負の相関をもつことを示した。
Tumarkin and Whitelaw(2001) は、1999 年 4 月から 2002 年 2 月までの、米国における掲示板 Raging
Bull への投稿の数やセンチメントと、リターンや出来高との関係を検証した。この研究では、掲示板への
投稿は一部のセクターを除き、リターンや出来高を有意に予測できず、その結果は市場が効率性であると
いう考えと整合的であるとしている。Antweiler and Frank(2004) は、米国のダウ・ジョーンズ工業株指
数とダウ・ジョーンズインターネット指数組み入れの 45 社について、150 万程の Yahoo!掲示板と Raging
Bull に投稿されたメッセージの投稿指標と株式指標の関係を検証し、強気と弱気の意見相違を示す指標と
メッセージ投稿数は出来高を予測すること、掲示板の投稿数が翌日の負の株式リターンを予測するが他と
比較して弱い結果であること、などを示した。Sabherwal et al.(2011) は、米国における 2005 年 6 月から
2006 年 6 月までの、投稿数が多くかつ株価に影響を与えるようなニュースのない 64 銘柄について、掲示
板指標と株式リターンの関係について検証し、時価総額が低く財務体質が悪い企業については掲示板指標
から翌日の負の株式リターンを予測することができ、これらを根拠にそのような企業の株式掲示板におい
ては風説の流布が行われている、と結論付けている。
Leung and Ton(2015) は、2142 社に関するオーストラリア最大の掲示板 (HotCopper) の、2003 年 1 月
から 2008 年 12 月までの 250 万程の投稿データを利用し、日次データに関するパネル回帰分析、月次デー
タに関する Fama and Macbeth(1992) の手法に基づいた分析、Mackinlay(1997) の手法に基づいたイベン
トスタディ、を行って強気比率指標などの掲示板指標と株式指標の関係を分析した。結果として、投稿数
と投稿のセンチメントが、正に有意に同時点または日次データについては一期先の時価総額が低い銘柄の
リターンに影響していること、ただし大型株は掲示板の投稿に有意な影響を与えていない結果が多いこと、
掲示板の投稿数は取引数などの様々な変数と強い相関を持っていること、などを示している。
一方、日本市場に関するインターネット掲示板と株式市場の関係についての分析としては、山下他 (2005)、
丸山他 (2008)、諏訪他 (2012) などがある。日本市場において発見できる最初のインターネット掲示板に
関する研究は、山下他 (2005) である。山下他 (2005) は、Yahoo!掲示板における投稿の特徴を分析し、ブ
ロードバンドの普及と市場の好転が 2003 年春以降の投稿数の増加の原因になっていること、同時期以降の
市場における売買代金や証券会社の約定数と投稿数の相関が極めて強いこと、人々の耳目を集めるニュー
スが各銘柄の掲示板の投稿数に強く影響を与えていること、を報告している。
丸山他 (2008) は、Yahoo!掲示板の投稿数上位 50 社 (2005-2006 年) の企業における 110 万程の投稿デー
タを利用して、強気比率指標などの掲示板指標と株式指標の相関係数を計算した。結果として、投稿数や強
気投稿数は翌日の異常リターンとの有意な相関が見られないが、弱気な投稿や投稿の強気比率指標はそれ
ぞれ翌日の異常リターンと有意に負、正の相関をもっていること、投稿数や強気比率指標がボラティリティ
や取引数と強い正の相関を有していること、などを示した。諏訪他 (2012) は、Yahoo!掲示板における東証
1 部上場の 1501 社 (2003-2008 年) についての 390 万程の投稿データを利用して、Fama and French(1992)
の手法に基づいて掲示板指標と月次リターンの関係性を分析しており、投稿数は株式リターンを説明する
可能性が低いが、投稿から作られる強気指数は株式リターンを説明する可能性があること、を報告して
6
いる。
また、インターネット株式掲示板以外のテキストデータにも着目した研究として、Tetlock(2007)、Tetlock
et al.(2008)、Tirunillia and Tellis(2012)、Yu et al.(2013)、岡田他 (2013) などがある。Tetlock(2007) は、
1984 年から 1999 年までの期間について、Wall Street Journal column の日々の内容に関するテキストデー
タを使い、マーケット全体の動向の予測可能性について論じている。Tetlock et al.(2008) は、S&P500 採
用銘柄について 1980 年から 2004 年の 35 万程の企業に関するニュースのテキストデータを用いて、個別
企業の利益やリターンの予測可能性について検証している。
Tirunillia and Tellis(2012) は、スマートフォン、おもちゃ、靴、パソコンなどの、ウェブ上での評判に影響を
受けやすいと思われる市場に関連する米国の 15 社について、Amazon.com、Eopinion.com、Yahoo!shopping
の web サイトから、2005 年 6 月から 2010 年 1 月における 35 万程の商品のカスタマーレビューあるいは
レーティングを収集しそれを集計して、カスタマーレビューに関しては機械学習の手法を用いて内容を評
価することで、それらと株式リターンあるいは出来高との関係について調べている。Yu et al.(2013) は、
2011 年 7 月 1 日から 9 月 30 日の米国における、薬品、小売、ソフトウェア、銀行、ホテル、医療、の 6
産業における 824 社について、ブログ、株式掲示板、Twitter、ニュースサイトの見出し、から 52747 個の
テキストを集め、それを利用したセンチメント指標と株式指標の関係を分析している。岡田他 (2013) は、
1986 年から 2010 年までの 22 万程の新聞の株式関連記事のテキストデータを用いて、株価の季節性につ
いてのアノマリーの原因を考察しており、25 年中 17 年は年前半の 1 月から 6 月の期間には楽観的な見通
しの表現が多く、7 月から 12 月までは先行きに慎重な表現が増加しており、これらが株価の方向性とかな
り一致していることを報告している。
しかし、日本における研究は、より掲示板に影響を受けると考えられる時価総額が低い銘柄における日
次データの分析が不十分であり、また、サンプル期間も古いものが多い。そこで本稿では、先行研究に基
づいて以下のような仮説を設定し、日本市場におけるアベノミクス開始後のサンプルを用いて、株式掲示
板の指標と株式指標の関係について検証する。
仮説 1: 時価総額の低い株式については強気な投稿が目立つ場合、リターンが大きくなる
仮説 2: 時価総額の高い株式銘柄についてはより投稿に影響を受けづらい
仮説 3: 強気な投稿が多い銘柄は、決算日直前までリターンが高いが、その後はリターンが低くなる
基本的に、仮説 1,2 のように、ある銘柄について強気な投稿が目立つ場合には、その株式の同時点のリ
ターンが大きくなり、その傾向が特に時価総額の低い銘柄について強いのは、Leung and Ton(2015) な
どが示している通りになると直感的にも思われる。しかし、Antweiler and Frank(2004) や Sabherwal et
al.(2011) などの研究から示唆されるのは、掲示板の強気比率指数は同時点のリターンと正の相関を有する
ものの、翌日以降のリターンは負となる可能性があり、それは、掲示板に風説の流布かそれに近い内容が
書き込まれ、それによって掲示板を参考に株を購入した個人が嵌め込まれている可能性があるということ
である。つまり、株式の価値と関係ない情報が掲示板に書き込まれて株価が吊り上がっている可能性が考
えられる。本稿ではこの点について、株価が掲示板の投稿で吊り上がっていた場合、決算発表日に冷静に
なって下落すると考え、仮説 3 を設定した。
7
第 3 章テキスト分類手法
本稿では単純ベイズ分類器 (Naive Bayes classifier) によって、テキストが「強気」
「中立」
「弱気」いずれ
の内容であるかの分類を自動的に行う。単純ベイズ分類器は、ベイズの定理を利用して文書の分類を行う際
に利用されているものであり、簡潔な方法でありながらそれと比較して分類精度が高いことから多くの研
究で使用されている。例えば、本稿との類似研究では、Antweiler and Frank(2004), Das and Chen(2007),
Sabherwal et al.(2011), Leung and Ton(2015) などが、単純ベイズ分類器を用いて株式掲示板のテキスト
を分類することで、実証分析を行っている。
一般に機械学習の手法を用いてテキスト分類を行う場合、分類に当たってコーパス (corpus) と呼ぶ、自
然言語の文章を構造化し大規模に集積したものを用いる。そして単純ベイズ分類器の場合、このコーパス
に属する各々のデータをクラスに当てはめた教師データ (training data) を作成して使用する。本論文では
後述の 3000 個の掲示板投稿のテキストデータをコーパスとして利用しており、教師データはそれらをク
ラス「強気」に 948 個、「中立」に 1428 個、「弱気」に 624 個の属性を付与したデータとなっている。ま
た、以下のように一つの文書を単語の集合であるというように捉える。Wk を k 番目の単語とすると、あ
る K 個の単語から成る文書 (Message とおく) は以下のように表現される。
M essage = {Wk }K
k=1
(3.1)
例えば「私はこの銘柄を買う」という文書があった場合、この文書は「私」「は」「この」「銘柄」「を」
「買う」という 6 つの単語の集合であると考える。ここで、分類するクラスを C とおくと、訓練集合から
クラス C を条件付けた時文字 Wk が出現する確率は、
P (Wk |C) = mkc /nc
(3.2)
と表せる。ただし、mkc はコーパスの内クラス C に属するとされる教師データ全体に含まれる単語 Wk
の個数、nc はコーパスの内クラス C に属するとされる教師データ全体に含まれるすべての単語の個数、
である。本論文においては C ∈ { 買い, 中立, 売り }、あるいは C ∈ { 買い, 売り } という 2 つの場合につ
いてテキストの分類を試みている。さらにここで、各々の単語が独立に生起するとする仮定の下で、ベイ
ズの定理より
∏K
P (C) × k=1 P (Wk |C)
P (C) × P (M essage|C)
=
P (C|M essage) =
P (M essage)
P (M essage)
(3.3)
が成立する。単純ベイズ分類器の「単純 (Naive)」というのは、この各単語互いに独立であるという、一
見成り立たないような仮定を置くというのを意味している。単純ベイズ分類器とはこの確率に基づいた分
類器であり、与えられた文章 (Message) に対して、P (C|M essage) が最大となるクラス C を出力するも
∏K
のである。P (M essage) はクラス C に依存しないので、上式より P (C) × k=1 P (Wk |C) を最大にする
C を考えればよい。
ただし、集積できるコーパスは有限であるため、P (Wk |C) = 0 となる場合がある。そのような単語が存
∏K
在する場合、P (C) × k=1 P (Wk |C)=0 となってしまい、適切な比較ができなくなってしまう。よって、
実用上は (3.2) 式を
nc /n + mkc
(3.4)
P (Wk |C) =
nc /n + nc
8
のように修正して計算を行う。ただし、n はクラスに依らず教師データ全体に含まれるすべての単語の個
数のことを示す。
前述のように、テキスト分類においては、単純ベイズ分類器を用いる以前に、文書を単語ごとに分解し
なければならない。英語などの言語の場合、文書は書かれる時点で既に単語ごとに分割されているので問
題はないが、日本語の場合はそうではないので、一定の基準で文書を単語ごとに分割する必要がある。本
稿ではそれを行うために、Mecab というソフトウェアを使用している。Mecab とは、京都大学情報学研
究科−日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて
開発された、日本語の文章を解析して形態素解析を行う、オープンソースのソフトウェアである。
また、Mecab では、文書を与えると単語ごとに分割すると同時に、それらの単語が付録 B に掲載した、
69 種の品詞のいずれであるかを判定する。ゆえに、その品詞の情報を用いて、文章の特徴語として適さ
ない単語を除去してテキスト分類を考える。具体的には、特徴語として付録 B の 69 種の品詞の内、2 番
の感動詞、10 から 12 番の形容詞, 27 から 30 番の接頭詞、31 から 33 番の動詞、 36 から 41 番、49 から
58、60 から 67 番の名詞、のみを選択し、それ以外の単語は除外して考えた。すなわち、文章から、数字、
数、記号、英字、日本語以外の単語、助詞、助動詞、接続詞、連体詞、副詞、代名詞、固有名詞を除去し
たものについて、単純ベイズ分類器を適用する。ただし、否定語を考慮するために助動詞の「ない」「無
い」
「ず」
「ぬ」も特徴語に含めている。感動詞については、丸岡他 (2008), 諏訪 (2012) では考慮されてい
ないが、textream の投稿においては投資家のセンチメントを示していることが多く、かつ感動詞を考慮す
ることで分類の精度が向上したために、含めることとしている。
9
第 4 章データ
本稿で用いるテキストデータは、掲示板 textream(http://textream.yahoo.co.jp/) における投稿データ
を用いている。付録の図 A.1 は、textream の投稿データの例として、2015 年 7 月における textream 内の
ソニーの掲示板の一部を抜粋したものである。このように、textream では、twitter などとは異なり、株
式銘柄ごとに異なる掲示板 (スレッド) が存在し、それぞれについて銘柄コード (ソニーの場合 6758)、投
稿時間 (分単位まで)、投稿者 (アカウント名)、投稿内容、を見ることができる。また、メッセージの投稿
者は、1 投稿ごとに 1 つ投稿内容について 5 つの属性 (強く買いたい、買いたい、様子見、売りたい、強
く売りたい) いずれかの「投稿者の気持ち」を任意で付与することができる。例えば、図の 319 番目の投
稿では、投稿に「強く売りたい」という属性が付与されているが、320 番目の投稿では属性そのものが付
与されていない。さらに、1 投稿ごとに「そう思う」
「そう思わない」という選択ボタンを押すことで、投
稿内容に対する評価を他の人が下すことができる。
本稿では、以上の利用可能なデータの内、銘柄コード、投稿時間、投稿内容、のみを利用対象とした。
除外したものの内、メッセージの属性に関する情報については、丸岡他 (2008), 諏訪 (2012) などでは教師
データを作成するために利用しているが、Antweiler and Frank(2004), Leung and Ton(2015) などでは利
用せずに著者が手作業で分類を行ったものを教師データとしている。本稿では、属性と投稿内容に著しい
乖離が見えるようなことが多く見受けられたため (例えば図 A.1 の 320 番目のような投稿あるいはスパム
のような投稿に、属性「強く買いたい」が付与されている場合など)、分類器を作成する際にノイズとなっ
てしまうと考えて利用しないこととした。また、
「そう思う」
「そう思わない」というボタンの集計数値に
ついては、最近の投稿ほど押された数が少なくなることや、何度でも押せるという問題があるために、考
慮しないこととした。
以上の情報を、プログラミング言語 Python で書いたプログラムを用いて、textream のサイトから自
動的に収集した。一般に Web サイトは HTML コードで規則的に記述されており、Python を用いて Web
ページに逐次的にアクセスして HTML コードの一定部分を繰り返し取得することで、目的の情報を収集
できる。本稿では、その情報を逐次的にデータベース MySQL に集積した。MySQL は世界で最も普及し
ているオープンソース・データベースとして知られており、大規模データを素早く操作するのに長けてい
る。MySQL に収集したデータを Python、Mecab と連携させてテキスト分類を行っている。
また、テキスト分類をするにあたっては、3 章で述べた通りまず Mecab で文章を単語ごとに分割する
必要があるが、その際、株式投資特有の専門用語やスラングなどを上手く判別できないことがある。例え
ば、「売り豚」というのは、株価水準に対して悲観的な人を皮肉る言葉としてよく使われているスラング
だが、Mecab でそのまま分割すると「売り」「豚」という 2 つの単語であるというように判定されてしま
う。このように、株式投資に関する用語を上手く分類できないことで、テキスト分類の精度が低くなる。
そういった事態に対応するために、本稿では、金融に関する専門用語等が掲載されている、金融経済用
語集-iFinance(http://www.ifinance.ne.jp/glossary/) 、投資に関するスラング的用語を解説している、投
資用語スラング辞典 (http://investment-word.com/) から載っている単語を Python を利用して MySQL
に蓄積し、それらも単語として認識するようにした (その他著者が選択したスラングも含めた)。
4.1 節で用いるデータについては、マーケットリターンの代理変数としての日経平均株価と個別株式の
リターン、出来高のデータを Yahoo!ファイナンス (http://finance.yahoo.co.jp/) から、時価総額のデータ
を日経 NEEDS FinancialQUEST から、取得した。特に個別株式のリターンや出来高のデータについて
10
は、株式分割や株式併合の影響を除外して調整した後の値となっている 1 。加えて 4.2 節で用いる決算日
時の情報については、日本取引所ホームページ (http://www.jpx.co.jp/) の銘柄検索画面 (適時開示情報・
決算に関する情報が掲載されている) と株探 (http://kabutan.jp/) から取得し、これらのサイトから得ら
れなかった場合は、個別に企業のホームページをチェックして MySQL に追加した。
データのサンプル期間としては、基本的に 2013 年 1 月始営業日から 2015 年 1 月末営業日までのデータ
を用いた。また、分析に使用する企業は、サンプル期間中に出来高が 0 である (取引が 1 回もない) 営業日
が 1 日も存在しない 2217 社に絞った 2 。
図 A.2 は、日時の掲示板への投稿数の累計を棒グラフで示したものである。総投稿数は 6173883 個であ
る。ここでは、1 年の内、年末や年初は投稿数が少なくなっていることが確認できる。また、2013 年 5 月
23 日には、取引時間中に 1 万 5942 円の高値をつけた日経平均株価の終値が 1 万 4483 円となり、前日比
1143 円安の歴史的大暴落となったことから、その周辺の時期にかけて、個別銘柄における掲示板の投稿数
が多くなっていることが確認できる。すなわち、全体の相場環境が掲示板の投稿にも影響を与えていると
考えられる。
図 A.3 は、曜日ごと 3 の取引数を合計したものであり、総投稿数はそれぞれ 847788(月曜日)、1102305(火
曜日)、1138405(水曜日)、886717(木曜日)、788597(金曜日)、811098(土曜日)、598973(日曜日) となって
いる。平日の内、火曜と水曜が投稿数が多くなっており、週明けと週末の月曜、金曜は投稿数が少なめと
なっている。休日は平日に比べて投稿数が少なくなっているが、土曜日は取引終了後の状況を受けた投稿
が増えるので、日曜と比較して投稿数が多くなっている。
1 ただし、増資による既存株式の希薄化などの他の影響は除外できていない。
2 ただし、後述の 5.2, 5.3 章では、2217 社からさらに絞った銘柄のみを使用しており、また、5.3 章の分析においての一部デー
タは後述のようにサンプル期間外のデータも用いている。
3 本稿では取引終了時間 15:00-翌日の 15:00 を 1 日として扱っているのでここでもそれに準じて計算を行っている。例えば、本
稿における月曜日の投稿数とは、日曜 15:00-月曜 15:00 の投稿数、を表している
11
第 5 章実証分析
5.1
テキスト分類
本節では、4 章で述べたテキストデータに対して 3 章の手法を適用して実際に分類を行い、分類の精度
について検証する。コーパスのテキスト分類は、3 章で述べたとおり、全ての投稿からランダムに抽出し
た 3000 個の投稿を、筆者が 1 件ずつ読んで「強気」か「中立」か「弱気」かを判別して行い、教師デー
タを作成した。手動で判別する基準として、「強気」へは、買いを推奨するものあるいは買ったことを報
告するもの、将来の企業業績または株価の上昇を期待するもの、マーケット全体に対する楽観的な見方を
含むもの等を、「弱気」へは、売りを推奨するものあるいは買ったことを報告するもの、将来の企業業績
または株価の下落予想およびマーケット全体に対する悲観的な見方を含むもの等を分類している。
「中立」
へは、
「強気」
「弱気」のどちらであるか判断できないような、その他の書き込みを分類している。以下で
は、このようにして作成した教師データに基づいて作成した単純ベイズ分類器により、各々の投稿文を強
気、中立、弱気の 3 つのクラスに実際のテキストデータを機械的に分類する。
本稿では、単純ベイズ分類器がどれだけの精度で分類をすることができるのかを、K-分割交差検証 (K-fold
cross-validation) の手法を用いて行った。K-分割交差検証では、標本群を K 個に分割して、その内の 1 個
を分類対象、残る K-1 個を教師データ (単純ベイズ分類器を作成するためのデータ) として分類を行い、真
のクラスに分類対象が分類できた標本数を調べる。交差検証は、K 個に分割された標本群それぞれをテス
ト事例として K 回検証を行い、そのようにして得られた K 回の結果を合計したものを結果として示す。
表 A.1 は、3000 個の教師データを用いて単純ベイズ分類器を作成し、その 3000 個の教師データ自体の
投稿データを分類した場合の正確さ (in sample accuracy) を計測したものである。今回の場合は標本を分
割することをしておらず (0-分割交差検証とも呼ぶ)、あくまで単純ベイズ分類器の作成に利用したサンプ
ル自体を分類した場合を考えている。以下の表中において Buy は「強気」、Hold は「中立」、Sell は「弱
気」、を示す。真のクラスが「強気」である投稿の 948 個中、909 個 (95.9%) が強気な投稿、23 個 (2.4%)
が中立な投稿、16 個 (1.7%) が弱気な投稿となっている。真のクラスが「中立」である投稿の 1428 個中、
160 個 (11.2%) が強気な投稿、1186 個 (83.1%) が中立な投稿、82 個 (5.7%) が弱気な投稿となっている。
真のクラスが「弱気」である投稿の 624 個中、23 個 (3.7%) が強気な投稿、16 個 (2.6%) が中立な投稿、
585 個 (93.7%) が弱気な投稿となっている。
表 A.2 は、3 分割交差検証の結果 (out of sample accuracy) を示している。真のクラスが「強気」であ
る投稿の 948 個中、623 個 (65.7%) が強気な投稿、231 個 (24.4%) が中立な投稿、94 個 (9.9%) が弱気な
投稿となっている。真のクラスが「中立」である投稿の 1428 個中、437 個 (30.6%) が強気な投稿、796 個
(55.7%) が中立な投稿、195 個 (13.7%) が弱気な投稿となっている。真のクラスが「弱気」である投稿の
624 個中、174 個 (27.9%) が強気な投稿、212 個 (34.0%) が中立な投稿、238 個 (38.1%) が弱気な投稿と
なっている。表 A.3 は 4 分割交差検証の結果を示しており、3 分割交差検証と同様の結果が得られている。
このように、分割数 K の値を変化させて頑健な結果となった。
また、同じコーパスを利用してクラスを「強気」「弱気」の 2 つのみと考えて教師データを作成した場
合も考慮した。
表 A.4 は、クラスが「強気」「弱気」の 2 つのみとして、3000 個の教師データを用いて単純ベイズ分類
器を作成し、その 3000 個の教師データ自体の投稿データを分類した場合の正確さ (in sample accuracy)
12
を計測したものである。真のクラスが「強気」である投稿の 1802 個中、1728 個 (95.9%) が強気な投稿、
74 個 (4.1%) が弱気な投稿となっている。真のクラスが「弱気」である投稿の 1198 個中、140 個 (11.7%)
が強気な投稿、1058 個 (88.3%) が弱気な投稿となっている。
表 A.5 は、クラスが「強気」「弱気」の 2 つのみとして単純ベイズ分類器を作成し、3 分割交差検証を
行った時の結果 (out of sample accuracy) を示している。真のクラスが「強気」である投稿の 1802 個中、
1443 個 (80.1%) が強気な投稿、359 個 (14.9%) が弱気な投稿となっている。真のクラスが「弱気」である
投稿の 1198 個中、572 個 (47.7%) が強気な投稿、626 個 (52.3%) が弱気な投稿となっている。表 A.6 は 4
分割交差検証の結果を示しており、ここでも 3 分割交差検証と同様の結果が得られている事が確認できる。
5.2
Comtemporary regression
本節では、2 章における仮説 1 と 2 を検証するために、前節で行ったテキスト分類を基に掲示板指標と
株式指標の関係について考察する。具体的には、時価総額を基準に分けた銘柄ごとに以下のモデルを設定
して分析を行った。
Ri,t = α + β1 M essagei,t + β2 Bullishnessi,t + β3 M arketReti,t + β4 Ri,t−1 + εi,t
V olumei,t = α + β1 M essagei,t + β2 Bullishnessi,t + β3 M arketi,t + β4 V olumei,t−1 + εi,t
(5.1)
(5.2)
被説明変数に関しては、Ri,t が銘柄 i の t 日のリターン、V olumei,t が日次取引数と 1 の和の対数値を
表している。
説明変数に関しては、M essagei,t が銘柄 i の t 日 (昨日の取引終了後 (15:00) から当日 15:00 まで) の投
稿数、Bullishnessi,t が銘柄 i の t 日の強気比率指標、M arketRett が t 日のマーケットリターン (日経平
均株価のリターン) 、M arkett が t 日のマーケットインデックス (日経平均株価の原数値) の対数値を示し
ている。M arkett に関しては、図 A.2 の 2013 年 5 月 23 日付近のような現象が、出来高に関しても存在
する可能性があるため、Antweiler and Frank(2004) などと同様に説明変数に加えている。
C
とし
ここで、銘柄 i の時間間隔 t における、あるクラス C∈{ 強気, 中立, 弱気 } に属する投稿数を Mi,t
た時に強気比率指標 (Bullishness index) を以下で定義する。
Bullishnessi,t =
強気
Mi,t
強気
中立
弱気
Mi,t
+ Mi,t
+ Mi,t
(5.3)
Antweiler and Frank(2004), Sabherwal et al.(2011), Leung and Ton(2015) などでは、
Bullishnessi,t =
強気
弱気
Mi,t
− Mi,t
強気
弱気
Mi,t
+ Mi,t
強気
中立
弱気
・ln (1 + Mi,t
+ Mi,t
+ Mi,t
)
(5.4)
を強気比率指標として定義し用いているが、本稿においては、先行研究よりも 5.1 節で示した out of
sample のテキスト分類精度が、特に真のクラスが弱気であるテキストの場合において劣っており、ラン
ダムに分類した場合の 1/3 に近いことから、弱気に分類された投稿数を計算時に使用しないような強気比
率指標の定義となっている。また、(5.4) 式の定義においては投稿数と 1 の和の対数値がかけられている
が、その場合、説明変数 M essagei,t と多重共線性の問題を引き起こす可能性があるので、それを除外し
て定義を (5.3) 式のようにした。さらに、5.1 節で「強気」と「弱気」の 2 つにだけ分類する場合も考慮し
たが、やはり真のクラスが弱気の場合に上手く分類できなかったことと、実態上強気とも弱気とも分類し
難いテキストが数多く存在することから、採用を見送った。
ただし、それでも Bullishness という指標については、テキスト分類に誤りが生じてしまう以上、Mea-
surement Error の問題が不可避的に発生する。そこで以下の 2 銘柄に関して Measurement Error の影響
13
について検証した。検証した銘柄は、タカラバイオ (銘柄コード: 3386)、オリエンタルランド (銘柄コー
ド: 4661) である。
タカラバイオは、ジャスダック上場のバイオ研究用試薬・研究用機器の商社であり、iPS 細胞やノーベ
ル賞、といった話題でバイオ関連銘柄に資金が集まる中で注目された。この銘柄は、時価総額が低く、か
つ個人投資家に人気のあった銘柄の 1 つとして選択した。2015 年 1 月末時点での時価総額は約 86.9 億円、
それまでのサンプル期間におけるコメント数は 5705 であった。一方、オリエンタルランドは、東京ディ
ズニーリゾートを経営・運営している東証 1 部上場企業であり、元々のブランド力や訪日外国人の増加な
どで注目された。この銘柄は、時価総額が高く、かつ個人投資家に人気のあった銘柄の 1 つとして選択し
た。2015 年 1 月末時点での時価総額は約 2 兆 5924 億円、それまでのサンプル期間におけるコメント数は
6896 であった。
Measurement Error の影響を具体的に検証する手法として、筆者が手作業でこれらのコメントすべてを
「強気」「中立」「弱気」いずれかに分類して 1 、それをもとに (5.3) 式の強気比率指標を計算し、単純ベイ
ズ分類器を用いて分類してそれをもとに計算した強気比率指標を用いたときとの回帰分析の結果の違いを
確認した。
表 A.7 はその回帰分析結果を示している。まず、表の左側のタカラバイオについては、手動で分類した
場合の Bullishness の係数と t 値がそれぞれ、0.0185, 2.331 となっており、自動で分類した場合のそれら
0.0137, 1.666 をかなり上回っている。また、自由度修正済決定係数についても、手動で分類した場合の
0.026 が、自動で分類した場合の 0.021 を上回っている。一方、表の右側のオリエンタルランドについて
も、手動で分類した場合の Bullishness の係数と t 値がそれぞれ、0.0107, 3.410 となっており、自動で分
類した場合のそれら 0.0081, 2.715 をかなり上回っている。同様に、自由度修正済決定係数についても、手
動で分類した場合の 0.019 が、自動で分類した場合の 0.011 を上回っている。また、手動で分類した時の
強気比率指標とアルゴリズムによって自動で分類した時の強気比率指標に関する相関係数は、タカラバイ
オが 0.476、オリエンタルランドが 0.633 となった。これらの結果から、やはり、手動で分類する場合に比
べて自動で分類する場合においては誤差が大きく、それが分析の結果に影響を与えることが伺える。一方
で、5.1 節で示した精度と比較するとある程度は分類が上手くいっていなくても、強気比率指標に関して
いえばバイアスが極端には大きくないとも考えられる。
以下では実際に分析を行っていく。5.2 節では、投稿数が上位 1000 位までのデータを 4 章で説明した
2217 社から選び、それらを時価総額が大きいグループ (Large) へ 100 銘柄、中間のグループ (Mid) へ 200
銘柄、小さいグループ (Small) へ 700 銘柄、へ振り分けてそれぞれのグループについて分析を行った。銘
柄数に差をつけているのは、時価総額の低い銘柄は高い銘柄と比較して密集して相当多く存在するためで
あり、Leung and Ton(2015) に倣ってこのように分類している。
表 A.8、A.9、A.10 はそれぞれ、時価総額が大きいグループ (Large)、中間のグループ (Mid)、小さいグ
ループ (Small) の銘柄に関する基本統計量を計算したものである。リターンなどのデータについての明ら
かな異常値も存在しないことが確認できる。Bullishness については Median、25%quantile、最小値がす
べて 0 であり、強気の投稿数が 0 である日が多いことに留意する必要がある。
表 A.11、A.12、A.13 はそれぞれ、時価総額が大きいグループ (Large)、中間のグループ (Mid)、小さい
グループ (Small) の銘柄に関する変数間の相関係数を計算したものである。Return−1 は 1 期前のリター
ンを示している。どの表においても、多重共線性を引き起こす原因となるような極端に高い説明変数間の
相関係数を示しているものは存在しない。リターンについての相関係数は、投稿数、強気比率指標につい
ては正で、かつ時価総額が低いグループへ向かうにつれ大きくなっていることが確認でき、リターンとの
相関係数である割には高めの値となっている。マーケットリターンに関しては、同様にリターンと正の相
関を有しているが、時価総額が低いグループでは相関が低い傾向を示していることがわかる。また、一期
前のリターンについては、表 A.11, 12 についてはほとんど相関がみられないが、時価総額が低いグループ
1 自動で分類する場合や教師データを作成する場合には使用していなかったが、ここでは分類の恣意性をできる限り排除するため
に、4 章で述べた「強く買いたい」
「買いたい」
「様子見」
「売りたい」
「強く売りたい」の項目も確認して、属性が付与されている場
合にはそれに従って分類を行った。
14
に関しては正の相関がみられる。
表 A.14 は時価総額が大きいグループ (Large)、中間のグループ (Mid)、小さいグループ (Small) の銘柄
について、それぞれリターンに関する (5.1) 式の固定効果パネル回帰分析を行った結果を示している。どの
グループにおいても、マーケットリターンがリターンを説明する一番大きな正の要因となっているとなっ
ていることがわかる。掲示板の投稿数に関しては、時価総額が大きいグループの場合に負に有意となって
いる (t 値=-2.95) が、時価総額が小さいグループの場合に正に強く有意となっている (t 値=16.98)。強気
比率指標に関してはいずれのグループの場合も正に有意である (Large: t 値=11.23, Medium: t 値=12.71,
Small: t 値=11.91) また、リターンを被説明変数にした際の定数項の係数がいずれのグループにおいても
有意ではないので、既存の説明変数で説明しきれていない要因があまりないと見て取れる。
表 A.15 は時価総額が大きいグループ (Large)、中間のグループ (Mid)、小さいグループ (Small) の銘柄
についてそれぞれ出来高に関する (5.2) 式の固定効果パネル回帰分析を行った結果を示している。どのグ
ループにおいても一期前の値が出来高を説明する一番大きな正の要因となっているとなっていることがわ
かる。次いで 2 番目にどのグループにおいても投稿数が一番大きな正の説明要因となっている (Large: t
値=18.74, Medium: t 値=39.98, Small: t 値=52.70)。また、強気比率指標についてもいずれのグループで
も正に有意となっている (Large: t 値=5.04, Medium: t 値=4.30, Small: t 値=8.29)。マーケットインデッ
クスの原数値については、t 値が Large: -1.74, Medium: t 値=-7.04, Small: t 値=-0.10、となっており、
中間のグループ以外有意になっていない。サンプル期間はアベノミクスにより右肩上がりで平均株価が上
昇し、日経平均株価の 2013 年大発会の始値が 10,605 円だったのに対し、2015 年 1 月 30 日終値が 17,674
円となるほどだったので、本来の説明変数としての意味をなしていない可能性がある。
5.3
イベントスタディ
本節では、Machinlay(1997) の標準的なイベントスタディの手法に基づいて、2 章における仮説 3 を検
証する。イベントスタディは大きく 6 つの段階に分けることができる。第一に、イベントの定義である。
ここで調べたいイベントを定義し、イベント前後のリターンを分析する期間であるイベントウィンドウ
(event window) を定める。本稿では四半期の決算発表をイベント日として定義し、イベントウィンドウ
はイベント発生前の 5 日、イベントの発生日 (決算発表後最初の営業日とする)、イベント発生後の 5 日、
からなる 11 日とする。第二に、対象とする企業の選択基準を決めることである。本稿においては決算発
表前後の動向を正確に捉えるために、取引終了時間 15:00 から 24:00 までに決算が発表された企業のみを
サンプル対象とした。第三に、正常リターンのモデル化、第四に、推定ウィンドウ (estimation window)
を定めてモデルの推定をし、異常リターンを推定することである。ここで、推定ウィンドウとはモデルの
パラメータを推定する際に用いるサンプルの期間である 2 。本稿では、正常リターンのモデルとしてマー
ケットモデルを選択した。マーケットモデルとは、任意の所与の株式のリターンをマーケットリターンに
関連づける線形モデルであり、(5.5) 式で表される。
R i = X i θ i + εi (5.5)
ただし、Riτ を銘柄 i, 時点 τ のリターン、ι は要素がすべて 1 の 120 × 1 ベクトル、Rm,τ を時点 τ の
マーケットリターン、αi , βi , σε2i をマーケットモデルのパラメータとして、
Ri = [Rit−125 , . . . , Rit−6 ]′
X i = [ι, Rm ]
2 通常推定ウィンドウとしては
Rm = [Rmt−125 , . . . , Rmt−6 ]′
120 日前までのデータを本稿は用いている
15
(5.6)
(5.7)
θ i = [αi , βi ]′
(5.8)
εi = [εit−125 , . . . , εit−6 ]′
(5.9)
E(εiτ ) = 0
V ar(εiτ ) = σε2i
(5.10)
である。また、120 個の観測値からなる推定ウィンドウを用いてマーケットモデルのパラメータの OLS
推定量は下式で与えられる。
θ̂ i = (X ′i X i )−1 X ′i Ri
σ̂ε2i =
1
ε̂′ ε̂i
120 − 2 i
(5.11)
(5.12)
さらに、異常リターンのベクトルは下式で計算できる。
ε̂∗i = R∗i − α̂i ι − β̂i R∗m
= R∗i − X ∗i θˆi
(5.13)
ただし、
R∗i = [Rit−5 , . . . , Rit+5 ]′
X ∗i = [ι, R∗m ] R∗m = [Rmt−5 , . . . , Rmt+5 ]′
θˆi = [α̂i , β̂i ]′
(5.14)
(5.15)
(5.16)
である。
次に第五の段階として、異常リターンの帰無仮説に関する検定を行う。以下で定義する累積異常リター
ン (Cumulative Abnormal Return) に対応する検定統計量を用いて、累積異常リターンに関する検定を行
うことができ、それを利用して同様に異常リターンに関する検定も、行うことができる。ここで、イベン
トウィンドウにおけるマーケットリターンを条件付けた時、異常リターンの条件付き期待値、条件付き分
散共分散行列は次のように表される。
E[ε̂∗i |X ∗i ] = E[R∗i − X ∗i θ̂ i |X ∗i ]
= E[(R∗i − X ∗i θ i ) − X ∗i (θ̂ i − θ i )|X ∗i ]
=0
(5.17)
∗
V i = E[ε̂∗i ε̂∗′
i |X i ]
∗′
∗
∗
∗′
∗
∗
′
∗′
′
= E[ε∗i ε∗′
i − εi (θ̂ i − θ i ) X i − X i (θ̂ i − θ i )εi − X i (θ̂ i − θ i )(θ̂ i − θ i ) X i |X i ]
(5.18)
2
= Iσε2i + X ∗i (X ′i X i )−1 X ∗′
i σεi
ゆえに、株式リターンと正規性の仮定と、イベントがリターンの平均や分散に影響を与えないという帰
無仮説の下で、
ε̂∗i ∼ N (0, V i )
16
(5.19)
が成立する。
また、γ を τ1 番目から τ2 番目までの要素が 1 でそれ以外の要素が 0 である (11 × 1) ベクトルとして、
時点 τ1 から τ2 までの累積異常リターンを以下のように定義する 3 。
[ i (τ1 , τ2 ) ≡ γ ′ ε̂∗i
CAR
(5.20)
このとき、累積異常リターンの分散は下式で得られる。
[ i (τ1 , τ2 )] = σi2 (τ1 , τ2 ) = γ ′ V i γ
V ar[CAR
(5.21)
よって、株式リターンと正規性の仮定と、上の議論と同様にイベントがリターンの平均や分散に影響を
与えないという帰無仮説の下で、
[ i (τ1 , τ2 ) ∼ N (0, σi2 (τ1 , τ2 ))
CAR
(5.22)
が成立する。
以上の結果は、1 つのイベントの標本に対して適用されるものだが、これを他のイベントの観測値の標
本を集計する場合に拡張する必要がある。以下では、異なる株式の異常リターンがそれぞれ独立であると
仮定する 4 。
(5.13) 式の ε̂∗i を用いて、個々の株式の異常リターンの平均値を求めることができる。イベント標本数
を N とする時、N 個の異常リターンベクトルの平均と分散共分散行列は以下のように求められる。
ε̄∗ =
N
1 ∑ ∗
ε̂ N i=1 i
V ar[ε̄∗ ] = V =
N
1 ∑
Vi
N 2 i=1
(5.23)
また、上の議論と同様に平均累積異常リターンベクトルの要素も時間に関して集計し、累積平均異常リ
ターンを下式のように定義する。
CAR(τ1 , τ2 ) ≡ γ ′ ε̄∗ (5.24)
同様に累積平均異常リターンの分散も下式で求まる。
V ar[CAR(τ1 , τ2 )] = σ̄ 2 (τ1 , τ2 ) = γ ′ V γ
(5.25)
イベント数が N であれば (5.20) 式、(5.21) 式から実際に累積平均異常リターンとその分散がそれぞれ
(5.26) 式、(5.27) 式のように計算できる。
CAR(τ1 , τ2 ) =
N
1 ∑[
CARi (τ1 , τ2 )
N i=1
V ar[CAR(τ1 , τ2 )] = σ̄ 2 (τ1 , τ2 ) =
N
1 ∑ 2
σ (τ1 , τ2 )
N 2 i=1 i
(5.26)
(5.27)
帰無仮説の下では以上リターンの期待値は 0 なので、累積異常リターンに関する検定は、
CAR(τ1 , τ2 ) ∼ N (0, σ̄ 2 (τ1 , τ2 ))
(5.28)
を利用して行える。実際には σ̄ 2 (τ1 , τ2 ) は既知ではないので、
ˆ 2 (τ1 , τ2 ) =
σ̄
N
1 ∑ 2
σ̂ (τ1 , τ2 )
N 2 i=1 i
(5.29)
3 本稿においては、τ は t − 5 時点に固定して、τ は t − 5 から t + 5 時点まで移動させて計算を行っている
1
2
4 本稿においては決算発表日が四半期ごとに行われるのに対し、イベントウィンドウが 11 日なので、イベントウィンドウが重なっ
ていることはない。
17
を一致推定量として用い、
J1 =
CAR(τ1 , τ2 ) a
∼ N (0, 1)
ˆ 2 (τ1 , τ2 )] 12
[σ̄
(5.30)
を利用して、累積異常リターンに関する帰無仮説の検定を行うことができる。異常リターンの検定に関
しても、γ の要素の内 1 つだけを 1 にすることで同様に行うことができる。
そしてイベントスタディの最後に第六段階として、得られた結果を適切に解釈をする。以上がイベント
スタディの枠組みとなる。
本稿では、以上のことを、時価総額を基準に分けられた 3 つのグループと、さらにそれを直前 30 日分
の投稿データから計算された強気比率指標の大きさによって 3 つに分けて分析を行った、サンプル数は全
部で 1099 銘柄の 8628 回分となった 5 。時価総額の大きいグループ (Large) は 100 銘柄、中間のグループ
(Mid) は 200 銘柄、小さいグループ (Small) は残りの 799 銘柄、となるように、毎月時価総額を基準にし
てグループを入れ替えており、強気比率指標の大きさに関しての分類はサンプルがほぼ均等に分けられる
ように 3 等分して行っている。また、5.2 節と異なり多重共線性の問題を考慮しなくてよいので、銘柄 i の
C
時間間隔 t における、あるクラス C∈{ 強気, 中立, 弱気 } に属する投稿数を Mi,t
とした時に強気比率指標
を以下で定義した。
Bullishnessi,t =
強気
Mi,t
強気
中立
弱気
Mi,t
+ Mi,t
+ Mi,t
強気
中立
弱気
・ln (1 + Mi,t
+ Mi,t
+ Mi,t
)
(5.31)
すなわち、(5.3) 式と、投稿数と 1 の和の対数、の積となっている。
表 A.16 は、それぞれ以上のイベントスタディを行った結果を示している。表中の Bull, Mid, Bear はそ
れぞれ強気比率指標が高いグループ、中間のグループ、低いグループ、L, M, S は時価総額のグループの
Large, Mid, Small のこと、All の部分は強気比率指標によって分類しないで L,M,S だけで分類すること、
Bull, Mid, Bear の真横の結果は時価総額によって分類しないこと、を示している。また、*, **, ***は、
それぞれ両側 5%有意、1%有意、0.1%有意であることを示している。
最初にすべてのサンプルについては、平均異常リターンに関して、t-1 日は正に 0.1%有意、t 日、t+1
日は負に 0.1%有意であり、累積異常リターンに関しては、t 日から t+5 日まで負に 0.1%有意、という結
果に元々なっていることがわかる。次に表における All の下の L, M, S の所を見ると、平均異常リターン
に関して、t 日の Large グループは正に 1%有意、t 日の Mid グループは正に 0.1%有意、、t 日、t+1 日の
Small グループは負に 0.1%有意、t-1 日の Small グループは正に 0.1%有意、累積異常リターンに関して
は、Small グループのみ t 日から t+5 日まで負に 0.1%有意、という結果になっており、全体のサンプルの
結果がサンプル数の多い Small グループに引っ張られてのものだったことがわかる。
この結果は、新興市場の方がファンダメンタルズに対して非合理的な高い期待を持って、株価が決算以
前に高い水準まで買われている傾向にあり、大企業の株式についてはより市場が効率的である、というこ
とを反映していると思われる。また、サンプル期間中は急激な円安が進行して、大企業が比較的高い利益
を生みやすい状況だったのに対し、円安メリットを享受できない中小企業、新興企業は、期待ほど利益を
あげにくかったことも原因の一つと考えられる 6 。
次に、Bull, Mid, Bear の真横の部分を見ると、平均異常リターンに関して、t 日、t+1 日の Bull グルー
プは負に 0.1%有意、t 日の Mid グループは負に 0.1%有意、t 日の Bear グループは有意でないとの結果
5 マーケットリターンと個別株式リターンは 2013 年以前のサンプルを使用したが、強気比率は 2013 年 1 月以降しか計算してい
ないので、決算発表日 (イベント日) が 2013 年 1 月、2 月の上旬の場合、強気比率のサンプルが 30 日分に満たなくなるため、その
ような場合は除外して考えている。また、このような場合が起こることをできるだけ少なくする意味を込めて、イベントスタディに
関しては土日の投稿も考慮して強気比率を計算している。
6 日本銀行引き受けによる国債の大量発行などの要因で急激な円安が進み、2013 年における大発会の日の始値 1 ドル 87.32 円か
ら 2015 年 1 月 30 日には 1 ドル 117.44 円までとなった。輸出中心型の大企業が円安効果で史上最高利益を上げる中、内需中心型
の中小企業は比較的その恩恵にあずかりにくい状態となっている。2013 年 5 月 23 日の暴落を機に調整をしつつ徐々に高値を更新
していった日経平均株価に対し、新興銘柄から成る東証マザーズ指数が 2013 年 5 月 15 日にサンプル期間中の最高値を既につけ、
それを上回ることが以後一度もないこともそれを象徴している。
18
となっており、累積異常リターンに関しては、Bull グループのみ t 日から t+5 日まで負に 0.1%有意、と
いう結果になっている。また、Bull グループの平均異常リターン、累積異常リターンは数値的にも All の
Small グループ、強気比率指標の Mid グループよりもかなり低い数値になっていることがわかる。つまり、
強気比率指標が決算前に高いグループに関しては決算後に負のリターンを被りやすく、低いグループでは
比較的市場が効率的となっていると考えられる。
次に、Bull の欄における L, M, S の部分を見ると、平均異常リターンに関して、t 日の Large グループ、
Mid グループは有意でなく、t 日、t+1 日の Small グループは負に 0.1%有意、t+2 日の Small グループは
負に 1%有意、との結果となっており、累積異常リターンに関しては、Small グループのみ t 日から t+5
日まで負に 0.1%有意、という結果になっている。また、この Bull グループでかつ時価総額が Small のグ
ループの累積異常リターンは、イベント日以降、この表と次表 A.17 と比べても最大のマイナス幅となって
いる。さらに、累積異常リターンが t 日以降マイナスの方向に増えていっているのは、決算発表後の株価
ドリフト (Post-Earnings-Announcement Drift) として知られるアノマリーと整合的である。決算発表後
の株価ドリフトとは、決算発表時に市場の期待より利益が上だった場合上がる方向へ、逆に下だった場合
下がる方向へ、株式の累積異常リターンが決算発表後に数週間あるいは数カ月の間向かう、という傾向を
示す、Ball and Brown（1968) で初めて論じられた古くから知られているアノマリーである。Bull グルー
プ内では銘柄に対する期待が過度に高い可能性が考えられ、その場合、決算発表時に期待より利益水準や
来期の利益予想が下である可能性が高まる。このことによって表の現象が説明できる可能性がある。
次に、強気比率指標の Mid の欄における L, M, S の部分を見ると、平均異常リターンに関して、t 日の
Large グループは正に 5%有意、時価総額の Mid グループは正に 1%有意、t 日の Small グループは負に
0.1%有意、との結果となっており、累積異常リターンに関しては、Small グループで t 日から t+3 日まで
負に 5%有意、という結果になっている。
次に、Bear の欄における L, M, S の部分を見ると、平均異常リターンに関して、t 日の Large グルー
プは正に 0.1%有意、時価総額の Mid グループは正に 0.1%有意、t 日の Small グループは負に 0.1%有意、
t-1 日の Small グループは正に 0.1%有意、との結果となっている。Bear の Small の欄における t 日の累積
異常リターンは t 日における Small の欄として唯一有意ではなくなっており、逆に、t 日における Large,
Mid(時価総額) の平均異常リターンが他と比べ最高となっている。このことは、時価総額が大きい銘柄に
ついても、掲示板における投資家のセンチメントが高まっていないほうが、株価が安く評価されており、
決算を機に評価されやすい、ということを示唆している。
表 A.17 は、表 A.16 における強気比率指標による分類を投稿数の対数の大きさによる分類に置き換えた
ときのイベントスタディの結果を示している。表の Bull より上の部分は表 A.16 と共通になっている。表
A.17 では表 A.16 と事実上似たような結果になっていることがわかるが、特に投稿数が多いグループにお
いては、決算後の累積異常リターンや平均異常リターンのマイナス幅が、強気比率指標で分けるのと比較
して小さいことがわかる。
19
第 6 章終わりに
6.1
結論
本稿では、インターネット株式掲示板 textream から投稿データを取得し、それをもとにした掲示板指
標と株式指標の関係性について検証した。
5.2 節では、仮説 1(時価総額の低い株式については強気な投稿が目立つ場合、リターンが大きくなる)
と、仮説 2(時価総額の高い株式銘柄については投稿により影響を受けづらい) に関して、時価総額を基準
に 3 つに分けたポートフォリオに対して固定効果モデルを用いた回帰分析を行うことによって、同時点に
おいては仮説が成立することを示した。また、同様に出来高についても掲示板の投稿数および投稿内容と
高い相関を持つことも示された。
5.3 節では、仮説 3(強気な投稿が多い銘柄は、決算日直前までリターンが高いが、その後はリターンが
低くなる) について、Mackinlay(1997) のイベントスタディの手法を用いて検証した。結果として、イベ
ント日以前は、強気な投稿が多い銘柄はリターンが高い状況はなく、イベント日以降に累積異常リターン
が低い状態が継続することが示された。また、この事実は決算発表後の株価ドリフトに関するアノマリー
と関連していることが考えられる。
これらの結果や、Antweiler and Frank(2004)、Sabherwal et al.(2011) 等の先行研究と合わせると、掲
示板の投稿が活発でかつ時価総額が低い銘柄は、全体として、浮動株が少なく値動きがしやすいのも相
まって同時点のリターンは高くなっており、それによってファンダメンタルズから乖離した非合理的な水
準まで、株価が高まりやすい状態になりやすくなってしまう、と考えられる。すなわち、掲示板の投稿に
より、市場の効率性が歪められている可能性があるというのが本稿の結論である。
6.2
今後の課題
本稿における課題はまず第一に、最も大きなものとして、テキスト分類の精度が低いことがあった。元々
日本語の場合、多くの先行研究であるような米国の研究よりも分類が難しい側面があるが、単語同士が独
立であるという仮定を置かない機械学習の手法である、Support Vector Machine を利用する、を教師デー
タを増やす、特徴語の選別を上手く行う、などにより改善できると考える。
第二に、一期先、二期先のリターンに関する予測が掲示板指標を用いて可能であるかを検証することで
ある。第三に、決算日においての分析を、利益に関する市場予想との乖離に関するデータも用いながら、
より包括的なものとすることが考えられる。第四に、投稿データにおけるアカウントを考慮した分析がで
きると興味深いと思われる。
20
参考文献
[1] Antweiler, W., and Frank, M. Z., (2004). Is All That Talk Just Noise? The Information Content
of Internet Stock Message Boards. Journal of Finance 59 (3), 1259-1294.
[2] Ball, R., and P. Brown, (1968). An Empirical Evaluation of Accounting Numbers. Journal of
Accounting Research 6 (2), 159-178.
[3] Das, S. R., Chen, M. Y., (2007). Yahoo! for Amazon: Sentiment Extraction from Small Talk on
the Web. Management Science 53 (9), 1375-1388.
[4] Fama, E. and French, K.R. (1992). The cross-section of expected stock returns. Journal of Finance
47, 427-465.
[5] Leung, H., and Ton T., (2015). The impact of internet stock message boards on cross-sectional
returns of small-capitalization stocks. Journal of Banking and Finance 55, 37-55.
[6] MacKinlay, A.C., (1997). Event Studies in Economics and Finance. Journal of Economic Literature
35 (1), 13-39.
[7] Sabherwal, S., Sarkar, S.K., and Zhang. Y., (2011). Do Internet Stock Message Boards Influence
Trading? Evidence from Heavily Discussed Stocks with No Fundamental News. Journal of Business
Finance & Accounting 38 (9-10), 1209-1237.
[8] Tetlock, P. C., (2007). Giving content to investor sentiment: The role of media in the stock market
Journal of Finance 62 (3), 1139-1168.
[9] Tetlock, P. C., Saar-Tsechansky, M., and Macskassy, S., (2008). More Than Words: Quantifying
Language to Measure Firms’ Fundamentals. Journal of Finance 63 (3), 1437-1467.
[10] Tirunillai, S., and Tellis, G. J., (2012). Does Chatter Really Matter? Dynamics of User-Generated
Content and Stock Performance, Marketing Science 31 (2), 198-215.
[11] Tumarkin, R. and Whitelaw, R.F., (2001). News or Noise? Internet Postings and Stock Prices.
Financial Analysts Journal 57, 41-51.
[12] Wysocki, P., (1999). Cheap Talk on the Web: The Determinants of Postings on Stock Message
Boards, Working paper, University of Michigan.
[13] Yu, Y., Duan. W., and Can, Q., (2013). The impact of social and conventional media on firm equity
value: A sentiment analysis approach, Decision Support Systems 55 (4), 919-926.
[14] 岡田克彦, 山崎高弘, 榊原茂樹, 山崎尚志 (2013). 株価変動の季節性と投資家心理-新聞記事に見る将来
見通しとデカンショ節効果-, 証券アナリストジャーナル, 51 (12), 96-105.
[15] 諏訪博彦, 梅原英一, 太田敏澄 (2012). ファクターモデルによるインターネット株式掲示板の投稿と株
式リターンの分析, 情報処理学会論文誌, 53 (1), 117-125.
21
[16] 丸山健, 梅原英一, 諏訪博彦, 太田敏澄 (2008). インターネット株式掲示板の投稿内容と株式市場の関
係, 証券アナリストジャーナル, 46 (11-12), 110-127.
[17] 山下一雄, 石上隆達, 佐藤哲也 (2005). インターネット掲示板にみる社会的関心と株価変動の関係, 日
本社会情報学会第 20 回全国大会研究発表論文集, 237-240.
22
付録A
図 A.1:
図表
textream の投稿データ (例: 日本におけるソニーの掲示板)
23
図 A.2:
textream の投稿データ (時系列)
図 A.3:
textream の投稿データ (曜日別)
24
表 A.1: insample accuracy(C=Buy, Hold or Sell)
筆者による分類
%
アルゴリズムによる分類
Buy
Hold
Sell
Buy
948
909
23
16
Hold
Sell
1428
624
160
23
1186
16
82
585
3000 個全てのサンプル
3000
1092
1225
683
表 A.2: out of sample accuracy(3-fold cross validation, C=Buy, Hold or Sell)
筆者による分類
%
アルゴリズムによる分類
Buy
Hold
Sell
Buy
948
628
233
87
Hold
Sell
1428
624
445
181
779
199
204
244
3000 個全てのサンプル
3000
1254
1211
535
表 A.3: out of sample accuracy(4-fold cross validation, C=Buy, Hold or Sell)
筆者による分類
%
アルゴリズムによる分類
Buy
Hold
Sell
Buy
Hold
Sell
948
1428
624
623
437
174
231
796
212
94
195
238
3000 個全てのサンプル
3000
1234
1239
527
表 A.4: insample accuracy(C=Buy or Sell)
筆者による分類
%
アルゴリズムによる分類
Buy
Sell
Buy
Sell
1802
1198
1728
140
74
1058
3000 個全てのサンプル
3000
1868
1132
25
表 A.5: out of sample accuracy(3-fold cross validation, C=Buy or Sell)
筆者による分類
%
アルゴリズムによる分類
Buy
Sell
Buy
Sell
1802
1198
1427
574
375
624
3000 個全てのサンプル
3000
1254
1211
表 A.6: out of sample accuracy(4-fold cross validation, C=Buy or Sell)
筆者による分類
%
アルゴリズムによる分類
Buy
Sell
Buy
Sell
1802
1198
1443
572
359
626
3000 個全てのサンプル
3000
1254
1211
表 A.7: パネル回帰分析 (具体例): 結果
被説明変数
手動
係数
定数
コード:
Returnt
分類
t値
−0.0118 −2.612
3386
自動
t値
係数
t値
−0.0103 −2.302
0.0005
0.309
0.0007
0.394
2.328
2.331
1.516
0.0050
0.0137
0.2390
2.267
1.666
1.396
Returnt−1
0.0475
1.055
0.0498
1.104
0.026
4661
係数
0.0051
0.0185
0.2588
AdjustedR
手動
t値
係数
M essaget
Bullishnesst
M arketRett
2
コード:
Returnt
自動
0.021
26
−0.0005 −0.765
0.0107
3.410
−0.0348 −0.766
0.0421
0.882
0.019
−0.0005 −0.734
0.0081
2.715
−0.0380 −0.831
0.0542
1.136
0.011
表 A.8: 使用データ (基本統計量: Large)
Return M essage Bullishness M Return M arket V olume
Mean
SD
0.0013
0.0211
1.1033
1.2542
0.2103
0.3090
Skewness
Kurtosis
Max
0.6031
6.7963
0.2421
1.4367
2.2169
7.6123
1.4178
0.9239
1.0000
75th
Median
0.0118
0.0006
1.7918
0.6931
0.3333
0.0000
0.0094
0.0011
9.6459
9.5959
17.558
15.546
−0.0099
−0.2149
0.0000
0.0000
0.0000
0.0000
−0.0067
−0.0732
9.5412
9.2579
14.372
8.007
25th
Min
0.0012
0.0149
9.5831
0.1147
15.002
1.440
−0.3789 −0.7700
1.9913 0.6682
0.0553 9.7945
−0.220
1.233
20.780
表 A.9: 使用データ (基本統計量: Mid)
Return M essage Bullishness M Return M arket V olume
Mean
0.0015
0.9654
0.2063
SD
0.0278
Skewness 1.1833
Kurtosis 12.8138
1.2932
1.8783
3.8803
0.3191
1.4123
0.7803
0.3718
0.0131
8.5977
1.3863
1.0000
0.3750
0.0553
0.0094
9.7945
9.6459
19.714
17.092
0.0000
−0.0118
−0.2879
0.6931
0.0000
0.0000
0.0000
0.0000
0.0000
0.0011
−0.0067
−0.0732
9.5959
9.5412
9.2579
14.703
13.314
6.399
Max
75th
Median
25th
Min
9.5831
14.092
0.0149 0.1147
−0.3789 −0.7700
1.9913 0.6682
0.0012
1.652
−0.045
0.008
表 A.10: 使用データ (基本統計量: Small)
Return M essage Bullishness M Return M arket V olume
Mean
SD
Skewness
0.0021
0.0424
2.2149
0.8782
1.19279
1.6670
0.2130
0.3259
1.3232
Kurtosis
Max
21.6829
1.0468
2.8811
8.3260
0.4546
1.0000
1.9913
0.0553
0.6682
9.7945
0.026
20.333
75th
Median
25th
0.0144
0.0000
−0.0153
1.3863
0.6931
0.0000
0.4160
0.0000
0.0000
0.0094
0.0011
−0.0067
9.6459
9.5959
9.5412
15.295
12.366
10.773
Min
−0.3396
0.0000
0.0000
−0.0732
9.2579
4.615
27
0.0012 9.5831
0.0149 0.1147
−0.3789 −0.7700
11.716
1.897
0.218
表 A.11: 変数間の相関係数 (Large)
Return
Message
Bullishness
Return
Message
Bullishness
MReturn
Return−1
1.000
0.008
1.000
0.055
0.356
1.000
0.126
0.003
0.019
-0.003
-0.010
0.052
1.000
0.138
1.000
MReturn
Return−1
表 A.12: 変数間の相関係数 (Mid)
Return
Message
Return
Message
Bullishness
MReturn
Return−1
1.000
0.023
1.000
0.066
0.410
0.097
0.012
-0.004
0.025
1.000
0.009
1.000
0.059
0.107
Bullishness
MReturn
Return−1
1.000
表 A.13: 変数間の相関係数 (Small)
Return
Message
Bullishness
Return
Message
1.000
0.096
1.000
Bullishness
MReturn
Return−1
28
MReturn
Return−1
0.086
0.082
0.038
0.479
1.000
0.007
0.012
0.122
0.052
1.000
0.087
1.000
表 A.14: パネル回帰分析 (リターン): 結果
被説明変数
時価総額
Returnt
Small
係数
t値
係数
Medium
t値
係数
Large
t値
M essaget
Bullishnesst
−0.0027
0.0038
0.0082
−1.04
16.98
11.91
−0.0000
0.0002
0.0046
−0.00
1.07
12.71
0.0002
−0.0002
0.0039
0.26
−2.95
11.23
M arketRett
Returnt−1
0.3775
0.0219
25.14
4.88
0.2439
−0.0156
32.72
−3.78
0.1765
−0.0087
27.64
−4.72
定数
AdjustedR2
0.0274
0.0218
0.0173
表 A.15: パネル回帰分析 (出来高): 結果
被説明変数
係数
V olumet
Small
t値
係数
Medium
t値
係数
Large
t値
M essaget
Bullishnesst
3.5832
0.2255
0.0910
15.36
52.70
8.29
5.4441
0.1463
0.0315
32.61
39.98
4.30
4.7300
0.0517
0.0388
26.54
18.74
5.04
M arkett
V olumet−1
−0.0024
0.6694
−0.10
223.41
−0.1139
0.6961
−7.04
228.02
−0.0295
0.7088
−1.74
188.68
時価総額
定数
AdjustedR2
0.8556
0.9232
29
0.9267
表 A.16: イベントスタディ結果 (強気比率)
Day t
Abnormal
Average Returns
All L
M
t-4
-0.001
−0.297 −0.091
*
-0.084 −0.022
t-3
-0.001
t-2
-0.045
0.131 −0.073
t-1
0.225
***
0.125
0.021 −0.161
0.052
S
-0.020
0.015
-0.021
-0.013
Bull -0.101
0.018
0.063
-0.014
0.279
***
0.207
0.363
0.095
0.116
M
-0.650 −0.027
*
-0.286
0.236
S
-0.022
0.009
-0.000
-0.000
0.231
Mid -0.090
0.028
-0.067
-0.044
0.245
L
Cumulative
Abnormal Returns
t-5
-0.055
t
-0.704
***
0.390
**
0.354
***
-1.086
***
-1.627
***
−0.200
0.090 −0.182 −0.018 −0.112
L
-0.236 −0.022
0.100 −0.270
0.377
M
-0.016 −0.099 −0.093 −0.205
0.117
S
-0.070
0.030
-0.049
0.009
Bear 0.038
-0.055
0.006
-0.080
-2.161
***
-0.312
***
0.511
*
0.398
**
-0.610
***
-0.151
t+1
t+2
t+3
t+4
t+5
-0.302 -0.104 -0.109 0.008 -0.004
***
*
*
-0.146 0.298 -0.139 -0.126 -0.024
*
-0.154 -0.004 0.011 0.010 -0.025
-0.356
***
-0.623
***
-0.525
*
-0.404
*
-0.691
***
-0.139
-0.173 -0.135 0.023 0.003
**
*
-0.263 -0.141 -0.126 -0.100
*
0.261 -0.263 0.090 -0.118
-0.164
0.463 -0.160 -0.401 0.009
*
0.038 0.103 0.069 -0.092
-0.027
-0.141
0.045 -0.070 -0.093
-0.369 -0.146 -0.122 -0.140
**
0.061 -0.080 0.054 0.080
L
0.005 −0.228 −0.077 −0.046
0.311
***
0.222
*
0.121
M
0.059 −0.210
0.057
S
0.040
0.001
-0.010
-0.053
0.293
***
All -0.055
-0.055
-0.056
-0.101
0.124
L
-0.388
*
-0.105
-0.258
-0.331
-0.206
M
-0.297
*
-0.084
-0.084
-0.246
-0.193
S
-0.020
-0.006
-0.027
-0.040
0.239
Bull -0.101
-0.083
-0.020
-0.034
0.173
L
-0.677
-0.315
-0.219
-0.104
M
-0.650
*
-0.286
-0.847 -1.203 -1.376 -1.511 -1.489 -1.486
***
***
***
***
***
***
-1.454 -2.076 -2.339 -2.481 -2.607 -2.707
***
***
***
***
***
***
-0.304 -0.829 -0.568 -0.831 -0.741 -0.859
-0.051
0.039
-0.142
-0.161
-0.273 -0.677 -0.818 -0.773 -0.843 -0.936
S
-0.022
-0.012
-0.012
-0.012
0.219
Mid -0.090
-0.062
-0.129
-0.172
0.073
-1.942 -2.633 -3.002 -3.147 -3.269 -3.409
***
***
***
***
***
***
-0.239 -0.379 -0.318 -0.397 -0.343 -0.263
L
-0.236
-0.257
-0.158
-0.427
-0.051
M
-0.016
-0.116
-0.209
-0.414
-0.297
S
-0.070
-0.039
-0.089
-0.079
0.232
Bear 0.038
-0.017
-0.010
-0.090
0.132
0.074 −0.091
L
0.005 −0.224 −0.301 −0.347 −0.468
M
0.059 −0.151
S
0.040
0.041
-0.078
-0.169
-0.112
0.031
-0.023
0.271
30
-0.200 0.018 -0.144
*
-0.141 -0.124 -0.109
0.046
0.161
0.102
0.001
0.875 0.264 0.167 0.009 -0.069 0.039
***
0.806 -0.028 0.096 -0.127 0.031 0.123
***
-0.478 -0.175 -0.188 -0.114 0.153 -0.029
***
*
*
-0.580 -0.882 -0.986 -1.095 -1.087 -1.091
***
***
***
***
***
***
0.184 0.039 0.336 0.197 0.071 0.047
0.161
0.007
0.003
0.014
0.024 -0.000
0.460 0.296 0.759 0.599 0.198 0.207
***
0.100 0.073 0.111 0.214 0.283 0.191
***
-0.378 -0.578 -0.561 -0.705 -0.659 -0.498
*
*
*
*
-0.019 -0.159 -0.284 -0.392 -0.290 -0.289
0.407 0.671 0.837 0.847 0.779 0.818
***
0.693 0.665 0.761 0.634 0.665 0.787
*
-0.208 -0.382 -0.570 -0.684 -0.531 -0.561
*
**
表 A.17: イベントスタディ結果 (投稿数)
Day t
Abnormal
Average Returns
All L
M
Cumulative
Abnormal Returns
t-5
-0.055
t-4
t-3
-0.001 -0.001
−0.297 −0.091
*
-0.084 −0.022
t-2
-0.045
0.131 −0.073
0.021 −0.161
S
-0.020
0.015 -0.021
-0.013
投稿多 -0.086
0.015
0.017
-0.012
L
-0.256
-0.100
0.227
0.027
M
-0.218
0.200 -0.012
-0.195
S
0.028
-0.010 -0.044
0.026
投稿中 -0.108
-0.010 -0.032
-0.006
L
0.207
0.064
M
-0.501
*
-0.157
-0.199 -0.046
-0.063
S
-0.115
0.035 -0.017
0.011
投稿少 0.025
L
-0.136
M
0.089
S
0.058
-0.007
t-1
t
t+1
0.225 -0.704 -0.302
***
***
***
0.125 0.390 -0.146
**
0.052 0.354 -0.154
***
0.279 -1.086 -0.356
***
***
***
0.276 -1.530 -0.569
**
***
***
-0.076 -0.111 -0.475
*
0.039 0.031 -0.434
*
0.340 -2.105 -0.659
**
***
***
0.116 -0.460 -0.199
***
**
0.454 0.534 0.087
*
0.078 -0.002 -0.033
0.122 -0.703
***
0.278 -0.127
***
*
0.001 0.750
**
0.046 0.896
***
0.359 -0.438
***
***
0.010
-0.113
-0.231 -0.042
-0.310
-0.091
0.098
-0.202
0.017
0.020 -0.002
-0.071
All -0.055
-0.055 -0.056
-0.101
L
M
-0.297
*
-0.084
-0.388 -0.258
*
-0.105 -0.084
-0.246 -0.193
S
-0.020
-0.006 -0.027
-0.040
投稿多 -0.086
-0.071 -0.054
L
-0.256
-0.357 -0.129
M
-0.218
-0.018 -0.030
S
0.028
0.018 -0.026
投稿中 -0.108
-0.118 -0.150
L
-0.443 -0.235
M
-0.501
*
-0.157
-0.357 -0.403
S
-0.115
-0.080 -0.098
投稿少 0.025
L
-0.136
M
S
0.018
0.029
t+2
t+3
t+4
t+5
-0.104 -0.109 0.008 -0.004
*
*
0.298 -0.139 -0.126 -0.024
*
-0.004 0.011 0.010 -0.025
-0.173 -0.135 0.023 0.003
**
*
-0.211 -0.145 -0.080 -0.067
*
0.334 -0.221 -0.055 -0.200
-0.057
0.019 -0.138
-0.329 -0.157 -0.074 -0.057
*
-0.035 -0.084 0.049 0.011
0.391 -0.159 -0.151
0.063
0.090
-0.216 -0.098 -0.145
*
-0.137 -0.064 -0.098
-0.046
0.030
0.141
0.146 -0.143
0.079
0.005
0.057
0.043
0.168 -0.037 -0.172 -0.011
0.008 -0.005 -0.052
0.044
0.011
-0.186 -0.090 -0.106
*
0.067
0.058
0.124 -0.580 -0.882 -0.986 -1.095 -1.087 -1.091
***
***
***
***
***
***
-0.331 -0.206 0.184 0.039 0.336 0.197 0.071 0.047
0.161
0.007
0.003
0.014
0.024 -0.000
0.239 -0.847 -1.203 -1.376 -1.511 -1.489 -1.486
***
***
***
***
***
***
-0.066 0.210 -1.320 -1.889 -2.100 -2.245 -2.325 -2.393
***
***
***
***
***
***
-0.102 -0.179 -0.289 -0.764 -0.431 -0.651 -0.706 -0.906
-0.226 -0.186 -0.155
***
-0.001 0.340 -1.765
***
-0.156 -0.040 -0.500
*
-0.171 0.283 0.818
***
-0.466 -0.387 -0.390
***
-0.087 0.035 -0.668
**
-0.084 0.194 0.068
-0.366 -0.409
-0.719 -0.718
0.089
-0.002
0.096
-0.106 -0.060
0.017
0.038
0.035
-0.036
31
-0.589 -0.646 -0.627 -0.765 -0.734
-2.424 -2.753 -2.911 -2.984 -3.042
***
***
***
***
***
-0.699 -0.734 -0.818 -0.770 -0.759
**
**
***
**
**
0.905 1.296 1.137 0.985 1.127
-0.423 -0.360 -0.270 -0.123 -0.267
-0.884 -0.982 -1.127 -1.048 -1.043
**
***
***
**
**
-0.069 -0.133 -0.231 -0.174 -0.131
0.032 -0.013
0.155
0.117 -0.055 -0.065
0.836 0.844 0.838 0.786 0.830 0.841
**
*
*
*
*
0.323 -0.116 -0.301 -0.391 -0.497 -0.430 -0.372
付録B
その他: 品種の種類 69 個
0 その他, 間投, 1 フィラー (会話のスキマを埋める「あー」「ええと」などの発話), 2 感動詞, 3 記号, ア
ルファベット, 4 記号, 一般, 5 記号, 括弧開, 6 記号, 括弧閉, 7 記号, 句点, 8 記号, 空白, 9 記号, 読点, 10 形
容詞, 自立, 11 形容詞, 接尾, 12 形容詞, 非自立, 13 助詞, 格助詞, 一般, 14 助詞, 格助詞, 引用, 15 助詞, 格助
詞, 連語, 16 助詞, 係助詞, 17 助詞, 終助詞, 18 助詞, 接続助詞, 19 助詞, 特殊, 20 助詞, 副詞化, 21 助詞, 副
助詞, 22 助詞, 副助詞／並立助詞／終助詞, 23 助詞, 並立助詞, 24 助詞, 連体化, 25 助動詞, 26 接続詞, 27
接頭詞, 形容詞接続, 28 接頭詞, 数接続, 29 接頭詞, 動詞接続, 30 接頭詞, 名詞接続, 31 動詞, 自立, 32 動詞,
接尾, 33 動詞, 非自立, 34 副詞, 一般, 35 副詞, 助詞類接続, 36 名詞, サ変接続, 37 名詞, ナイ形容詞語幹,
38 名詞, 一般, 39 名詞, 引用文字列, 40 名詞, 形容動詞語幹, 41 名詞, 固有名詞, 一般, 42 名詞, 固有名詞, 人
名, 一般, 43 名詞, 固有名詞, 人名, 姓 , 44 名詞, 固有名詞, 人名, 名 , 45 名詞, 固有名詞, 組織 (極洋など),
46 名詞, 固有名詞, 地域, 一般, 47 名詞, 固有名詞, 地域, 国, 48 名詞, 数, 49 名詞, 接続詞的, 50 名詞, 接尾,
サ変接続, 51 名詞, 接尾, 一般, 52 名詞, 接尾, 形容動詞語幹, 53 名詞, 接尾, 助数詞, 54 名詞, 接尾, 助動詞
語幹, 55 名詞, 接尾, 人名, 56, 名詞, 接尾, 地域, 57 名詞, 接尾, 特殊, 58 名詞, 接尾, 副詞可能, 59 名詞, 代
名詞, 一般, 60 名詞, 代名詞, 縮約, 61 名詞, 動詞非自立的, 62 名詞, 特殊, 助動詞語幹, 63 名詞, 非自立, 一
般, 64 名詞, 非自立, 形容動詞語幹, 65 名詞, 非自立, 助動詞語幹, 66 名詞, 非自立, 副詞可能, 67 名詞, 副詞
可能, 68 連体詞
32

Download Report