Title カルマンフィルターを用いた株価予測モデルによる - HERMES-IR

Title
Author(s)
Citation
Issue Date
Type
カルマンフィルターを用いた株価予測モデルによる株式
市場の実証解析
田窪, 俊二; 田中, 義一; 高橋, 一
経済研究, 45(4): 322-333
1994-10-14
Journal Article
Text Version publisher
URL
http://hdl.handle.net/10086/20292
Right
Hitotsubashi University Repository
経済研究
Vo1,45, No.4,0ct.1994
カルマンフィルターを用いた株価予測
モデルによる株式市場の実証解析
田窪俊二・田中義一・高橋 一
状態空間モデノレにカルマンフィルタ
ないという立場にたって,純粋に金融市場のデ
ーを用いた反復解法を適用して,個別
ータからその統計的構造を解析し,確率モデル
銘柄に基づいた株式市場の実証分析を
として金融市場の構造を理解しようというアプ
行った.観測方程式の推定には因子分
ローチがある.その代表的なものとして各金融
析法を用い,状態方程式はノ1Rモデ
ルを適用した.状態変数の数はAIC
や正準相関分析を用いて5個とし,
資産の価格変動に直接単変量時系列モデル
ARモデルのラグ次数は.41Cを用い
市場の実体をよく反映するように,非正規性や
て各状態変数毎にそのつど決定した.
(/1R,ルL4,.4R躍4など)(Harvey[1989])を適
用した解析が行われている.さらに,より金融
このモデルを用いて株式市場の解析を
非線形性などを考慮したTaylorモデルや,
.4RCHモデルなども提唱.されている(刈屋
行ったところ,累積寄与率ならびに時
[1990]).また,複数の金融資産相互の関係を
系列次数の変化にブラックマンデーに
考慮し,それ’ら複数の変量を同時に扱うものと
伴う市場構造の変化を観測することが
して,ベクトル自己回帰モデル(玩4Rモデル)
できた.また,このモデルの予測性能
(山本[1988])を始めとする多変量時系列モデル
について評価したところ,市場構造の
を用いた研究もなされている.一方,複数の変
変化の少ない期間については予測の効
量の変動の裏に少数の共通変動要因を想定し,、
果があることがわかった.さらに,カ
その共通変動要因に時系列構造を適用する
.4P7’の変形であるルf7▽モデル(刈屋
ルマンフィルターを用いない解法と比
較したところ,カルマンフィルターを
[1986])も提案され・ている.
用いることによって,予測誤差を減少
本報告では,上記のルf7▽モデルの枠組みを
させることができた.
用い,そのモデル構造の推定法としてカルマン
フィルター(有本[1977])を用いた反復推定法に
1.序
統計的解析法を用いて金融市場の変動構造を
よる株価変動の分析結果について報告する.経
済データの実証分析においてカルマンフィルタ
ーを用いた例は随所にみられる.しかしながら
解析する研究は様々なアプローチで盛んに行わ
それらの多くは,合理的期待仮説の検証¢ngle
れている.因果的発送に基づいたアプローチと
and Watson[1987])や技術移転の検証(Slad
しては,回帰分析を用いて金融市場のデータと
[1989]),またHarvey and Todd[1983]の様な
各種補助情報(例えば株価の変動に対しては,
マクロ時系列を“ゆっくり変化する(Slowly
各社の財務状況を示す種々のデータなど)との
changing)”トレンド,季節変動と不規則変動
因果関係を分析する方法がよく使用される.そ
の和に分解するために用いられている.1為替市
れに対し,金融市場の変動構造は非常に複雑で
場の分析に対しては深尾[1988]が,一方株価変
不確実性が高く,経済学的な理論では把握でき
動の分析に応用された例としてはShiba and
カィレマンフィルターを用いた株価予測モデルによる株式市場の実証解析
323
Wago[1989]があるが,そこでは単に日経平均
εfやη診は互いに無相関とし,対角行列φ,Ψ
の分析に適用されている.本論文では個々の銘
を用いた以下の式で表される仮定を設ける.
柄の日次データにMTγ一カノレマンフィルター
E(ε∂=0,砲γ(εご)=φ
を適用して分析を進めた.
E(η‘) =0, 琉zγ(ηの = ψ’ (3)
第2節では,使用したモデルおよびその推定
Coo(εf,ηの =0
方法について説明する.第3節において実際に
過去の株価データを用いての実証分析結果およ
2.2 モデルの推定方法
びその考察について述べ,最後に第4節でまと
モデルの推定方法としては,以下の2通りの
めを行う.
アプローチが考えられる.
2.モデルおよび解法について
2.1 株価変動モデル
(i)状態変数として各種経済指標などを用い,
回帰分析などを用いてモデル構造を決定する.
このアプローチでは,状態変数の素性が明確
株式市場の価格変動構造のモデルとして,
なため結果がわかりやすいなどの利点がある.
ル17▽’モデルを用いる.ル1Tyモデルは,
その一方で,状態変数として定性的なものを
.4P7’理論が仮定するファクターモデノレを定式
取り入れることが困難である,また状態変数
化したも.のである観測方程式(1)と,それによ
の選び方によって結果が左右されるなどの問
って抽出される状態変数の時系列構造を定式化
題点もある.
した状態方程式(2)によって表わされる(刈屋
(ii)状態変数は直接観測不可能として,多変量
[1986]).
解析法などを用いて株価データから推定する.
銑=ノ蟻十ε‘ (1)
このアプローチでは(i)と比較して状態変数
ノ}=B1プ}_1十B2ノ傷_2一←… 斗・B読_ん十・η‘(2)
として相場感や社会情勢などといった定量的
ここで,銑は時刻’におけるρ個の銘柄の
な指標とならない要因も状態変数として抽出
株価データを要素とするρ次元ベクトルで,ゐ
できる可能性がある.しかし一方では,状態
は時刻’におけるσ個の状態変数を要素とす
変数の時系列構造はあくまでも状態変数の推
るσ次元ベクトノレである.状態変数は株価変
定値から求めなければならないため精度が悪
動のうち複数銘柄に共通する成分に対応するも
くなる,また推定された状態変数の素性がは
ので,各銘柄の株価変動をそれら状態変数の線
・つきりせず,結果の解釈や判断が難しいとい
形和で表したのが観測方程式である.ここで
つた問題点があげられる.
.4は因子負荷量行列と呼ばれるρ×σの係数行
列で,εオは株価変動のうち状態変数で説明する
潮回の解析では,特定の経済指標などと株価
ことのできない成分,すなわち各銘柄独自の変
変動との関連を調べることが目的ではないため,
動成分である.時系列的な構造は状態変数につ
株価データのみで解析をおこなうことのできる
いてモデル化し,それから株価変動の時系列的
(ii)のアプローチで解析をおこなった.状態変
,構造を求める.その状態変数の時間的変動構造
数ならびに観測方程式構造の推定には多変量解
を表したのが状態方程式である.モデルとして
析法の一つである因子分析法(柳井他[1990])を
は,時刻’での変数の値をそれ以前の値の線形
用いた.そして,このアプローチで問題となる
和で表すARモデノレを用いる.ここでη,は,
状態方程式構造の精度を上げるため,その推定
状態変数の時系列構造における撹乱項であり,
にカルマンフィルターを応用した手法を適用し
且(F1,…,ん)は時系列構造の係数である.こ
た.
こでは各状態変数は互いに無相関であるという
観測値である株価デ藁タ銑には雑音が含ま
条件を課すため,すべて対角行列となる.また,
れ’ていると考えられるため,そのデータから状
324
経 済 研 究
図1解析手順
株式データ&=(SM,82,1,_, Sρ,‘)
↓
収益率データ観=(¢1,f,τ2,‘,_,」rρ,8)一一一一一一一一一一一一一一一一一一__一__r
観測方程式の推定(因子分析法)
』rf=/)}十ε‘
一一一■一一一一一一一一一一一一輔一 u
ほ
内[釦
状態方程式の推定(、4R時系列解析)
カルマンフィルタ
轟=B茄一1+B議.2+…+軌五一κ+玩
謬言廊一1+κぼrA伽.1)
収束判定
態変数五をできるだけ精密に推定するため,
図1は一連の解析手順を示したものである.
システム工学の分野で発達したカルマンフィル
まず最初に各株価データを収益率に換算し,平
ターを導入する.
均0分散1に規格化する.次にそのデータに対
式(1)及び式(2)で表わされる状態空間モデル
して因子分析を行い,観測方程式の構造である
は,状態方程式を1階のマルコフ表現に変換す
ることによって以†の式で表わされるカルマン
行列A,および状態変数みの推定値を求める.
状態変数の推定値が得られたら,そのデータを
フィルターを適用することができる(Harvey
もとに状態方程式の構造を推定する.
[1989]).なお,式の導出に関しては付録を参
ここで,状態方程式の構造が求められたため,
照されたい.
カルマンフ.
ノ1∼;五け_1十、κ(銑一、4∫‘1‘一、) (4)
具体的には,解析期間内のデータに対し,状態
ここで,ノ}i卜、は時刻’一1までの観測値が与
方程式の構造に基づいて状態変数の内挿を行う.
えられたときの時刻’の状態変数の予測値,銑
そしてその内挿値に対してカルマンフィルター
は時刻’における観測値である.この式では,
をかけて,状態変数のよりよい推定値を求める.
五1‘一、から推定される観測値の予測値A五1卜、
Cルターを適用することができる.
このようにして状態変数の更新を行ったため,
と実現値銑との差を補正項とし,五1‘一、に対し
状態変数から推定を行った状態方程式の構造も
て補正を行う構成となっている.その時の補正
再推定する必要がある.この操作を,状態方程
項の係数KはA,B,の,Ψによって決定され
式が十分安定するまで繰り返すことによって,
る.
状態空間モデルに基づく株価変動構造を精密推
なお,カルマンフィノレターは,上記の観測方
定する.なお,収束判定は時系列構造の撹乱項
程式と状態方程式(差分式)が与えられ,その構
の分散を用いて行う.
造が既知であることが前提である.ところが,
ここでは状態変数からその時系列構造を求める
ため,状態方程式の構造は既知ではない.そこ
3.実験結果と考察
で,状態変数の推定値と状態方程式の構造を反
3.1実験条件
復推定することとした.以下その手順について
上記のモデルおよび解法を用いて実際の株価
述べる.
データについて解析を行った.解析データは,
325
カルマンフィルターを用いた株価予測モデルによる株式市場の実証解析
表1通し日数の割り付け
(a)
通し日数
年/月/日
通し日数
年/月/日
通し日数
年/月/日・
1日目
1987/ 1/ 5
300日目
1988/2/5
550日目
1989/1/6
50日目
3/10
5/18
7/20
9/22
350日目
4/12
600日目
3/20
400日目
450日目
6/20
650日目
700日目
6/2
8/22
500日目
10/27
750日目
10/24
796日目
・ 12/29
100日目
150日目
200日目
250日目
11/27
8/11
’
(b)
解析期間
解析期間
予測期間
解析期間
解析期間
予測期間
(通し日数)
(年/月/日)
(5日間)
(通し日数)
(年/月/日)
(5日間)
1988/2/6∼1988/10/27
10/28∼11/2
1∼200
1987/1/5∼1987/9/22
9/24∼9/29
51∼250
1987/3/11∼1987/11/27
11/28∼12/29
101∼300
1987/5/19∼1988/2/5
2/6∼2/12
151∼350
1987/7/21僧1988/4/12
4/13∼4/19
301∼500
351∼550
401∼600
451∼650
201.∼400
1987/9/24∼1988/6/20
6/21∼6/25
501∼700
1988/10/28∼1989/8/11
8/14∼8/18
251∼450
1987/11/28∼1988/8/22
8/23∼8/27
551∼750
1989/1/9∼1989/10/24
10/25∼10/31
1988/4/13∼1989/1/6
1/9∼1/13
1988/6/21∼1989/3/20
3/22∼3/28
1988/8/23∼1989/6/2
6/5∼6/9
図.2解析期間
解析期間(200日間)
第1日目 予測期間(3∼5日間)
第796日目
L_一、__⊥一___一、___」
』
この間のデータを用いて 推定されたモデル構造を
モデル構造を推定 もとにデータを予測
この構成を様々な期間にあてはめて解析を行う
1987年から1989年までの東京証券取引所の株
タのなかから200日間を解析期間として,モデ
価の終値データを使用し,日次デー.タから,次
ル構造の推定に用いた.さらに解析期間に続く
の式で定義される連続複利収益率をデータとし
数日を予測期間として,モデル構造を用いて・の
て解析を行った.
予測に用いた.表レbは,今回の実験に用いた
銑=logS‘一10gS卜1 (5)
解析期間についてまとめたものである.なお,・
解析に用いる銘柄群は,1987年から1989年
各銘柄のデータは解析に用いる200日間のデー
タで平均0,標準偏差1となるように規格化す
までの期間に日経平均株価算出に採用されてい
た223銘柄を銘柄母集団として,その中から
100銘柄を選択した.データには1987年1月5
今回の解法では,観測方程式の推定に因子分
日を第1日として取引の行われた日に通し目数
析法を用い,時系列構造のモデルとして.4R
をつけた.通し日数と日付の関係を表1−aに
モデルを用いる.その場合,因子分析法によっ
に示す.ここでは休日は無視し日数には数えな
い.ただし,取引が行われていたにもかかわら
て抽出する状態変数の数σと,各状態変数の
、4Rモデノレのラグ次数(以下時系刻次数と呼
ず価格がつかなかった日については,その前日
ぶ)んについては何らかの方法で決定してやる
る.
の株価と同じとした.総データ日数は,3年間
必要がある.
で796日である.図2に示すように,そのデー
状態変数の数σについてはさまざまな期間
/
326
経 済 研 究
表2 解析に使用した銘柄群
銘柄群A
銘柄群B
極洋,日水,住友炭,大成建,清水建,飛島建,鹿島建,
東亜建,日本粉,台糖,森永,明乳,アサヒ,宝酒造,日
日魯,三井山,帝石,佐藤工,フジタ,鉄建,日清粉,明
目,サッポロ,キリン,合同酒,キッコマン,ニチレイ,
清油;味の素,片倉,鐘紡,日東紡,大東紡,帝人,東邦
東洋紡,ユニチカ,日清紡,帝繊維,東レ,三菱レ,旭化
レ,クラレ,山国パ,本州紙,三菱紙,三面圧,住友化,
日産化,日曹達,東合成,信越化,日本化,日油脂,武田,
成,王子紙,十条紙,北越紙,昭電工,菱化成,電化,カ
大日薬,昭和シェル,東燃,ブリヂストン,板硝子,住友
セ,幽霊セ,カーボン,東陶,川鉄,住金,ステンレス,
冶金工,日製鋼,日軽金,東邦鉛,日鉱,同和鉱,住友電,
昭電線,東京鋼,大隈鉄,久保田,千代建,日精工,光洋
精,日立,三菱電,明電舎,富士通,松下,ソニー,横河
電,湯浅電,日立造,トヨタ,マツダ,鈴木自,リコー,
ーバイド,協発酵,宇部興,旭電化,富士写,三共,山之
内,日石,三菱石,浜ゴム,旭硝子,日セメ,小野田,ノ
リタケ,ガイシ,新日鉄,神戸鋼,日金工,日本電工,菱
製鋼,三井金,三菱金,住友鉱,古河電,藤草線,新潟鉄,
小松,荏原,日ビス,不二越,東芝,富士電,日電気,沖
電気,シャープ,三洋電,日電装,三井造,三菱重,石川
島,いすr,日野自,本田技,日車両キャノン,シチズ
凸版,丸紅,住友商,三越,高島屋,丸善,東銀,三菱銀,
ン,大日印,伊藤忠,三井物,岩谷山,東急百,松坂屋,
住友銀,三菱信,日興,日証金,大正海,三井不,平和不,
東急,小田急,京成,郵船,昭和海,三菱倉,東電,東ガ
第一勧銀,三井銀,富士銀,三井信,日信販,野村,東海
上,安田火,菱地所,東武,京急,京王,日通,商船三井,
ス,松竹,東映,後楽園
川崎汽,全日空
社名略号は,日経会社情報(日本経済新聞社)で使用されているものを用いた.
これにより,.解析の結果最適な時系列構造が10
について解析を行い,もっとも適切な数を選定
し全;期間について同じ数を用いて解析を行った.
次以上と判断される場合は,時系列構造がない
解析は,以下の2通りの方法で行った.
と判断することとした.なお,状態方程式(2)
(i)状態変数の数を変えながら因子分析を行
によって行う状態変数の推定は,解析期間のは
い,.躯Cを用いて状態変数の数を推定す
じめから数えてK+1日目のデータからと統一
る方法.この時,AICは次の式を用いた.
した.これは,時系列次数によって推定の対象
AIC(の=一(%一1){lo9(1Σ1
になるデータの期間が変化しない.ようにするた
+’γ(RΣ一1)}+2ρ(σ十1)一σ(σ一1)(6)
めである.
解析に使用した計算機はHITAC M 680で,
ここで,Rはデータの相関係数行列であ
り,Σは因子分析を行ったあとその結果か
解析プログラムはFORTRANを用いて自作し
た・デ←・は㈱鮮経漸鮒発行の・CD一
ら逆に相関係数行列を推定しなおしだもの
で,以下の式で求められる.
株価」のデータを使用した.
Σ=ん4’+φ、 (7)
(ii)異なった2つの銘柄群について状態変数
3.2市場構造についての考察
の抽出を行い,どちらからも抽出された状
今回使用したモデルは,モデルは観測方程式
態変数の数を正準相関分析を用いて判定す
(1)と状態方程式(2)の2式で構成され,それぞ
る方法.
れ因子分析法,カルマンフィルターを用いた反
詳細は述べないが,これらの解析結果をもとに.
復推定法による時系列解析によって解析を行っ
最終的に状態変数の数を5と決定した(cf.明田
ている.これらの解析によって,市場構造を特
[1989]).
徴付ける様々な量を求めることがで.きるが,そ
一方,各状態変数ゐ時系列次数んについて
れらの中から特に,因子分析法については累積
は,時系列構造の推定を行う度に以下の式で求
寄与率を,そして時系列解析では時系列次数を
められる.躯Cを用いてもっとも最適な次数を
用いて市場の構造を解析した.この時使用した
選択した.
銘柄群は,223銘柄の銘柄母集団より2通り構
〆11C(々)=(T一κ)Io9(2πΨ)十(T一κ)
成した.その際各銘柄群に各業種が平均的に含
十2(々十1) (8)
まれ,かつどちらの銘柄群にも含まれる銘柄が
ここで,7’は解析期間,Kは取りうる時系列次
存在しないようにした.表2にその2通りの銘
数の最大値で,今回の実験では10に設定した.
柄群の一覧を示す.
327
カルマンフィルターを用いた株価予測モデルによる株式市場の実証解析
図3累積寄与率の推移
銘柄群Aについて
60
, ∀
’
ノ’’
、
@ 30 20
累積寄与率︵%︶
ノ
岬
一
戸
/ノ
イ
︸
か
/
\レ
、
、
、、
’
一亀一∼覧、、、
@ 30 20
累積寄与率︵%︶
10
40
も ノ
’
50
7
50
40
銘柄群Bについて
60
、 /、
、 !/ ’
1 ダ
、 ’
、 ’
10
、 ’
1 ’
、 ’
、 ’
レ_4
0
1 101 201 301 401 501
0
∼200 ∼300 ∼400 ∼500 ∼600 ∼700
∼200 ∼300 ∼400 ∼500 ∼600 ∼700
解析期間(通し日数)
解析期間(通し日数)
1 101 201 301 401 501
→一累積寄与率
一→一一時系列構造を持つ因子による累積寄与率
なおこの解析では,市場構造の変化について
のグラフが累積寄与率を示したものである.な
できるだけ細かくみるために,解析期間を50
日ずつ移動させて計11の期間について解析を
お,点線のグラフについては後で説明する.こ
行った.
(a)累積寄与率について
れをみると,解析期間が第51日目∼第250日
目より第201日目∼第400日目までの間は,そ
の他の期間に比べ約2倍の値になっていること
がわかる.これらの解析期間に共通なのは,通
共通変動要因である状態変数が,株価の変動
し日数では220日目にあたる1987年10月19
をどれだけ説明しているかをあらわす指標とし
日に起こったブラックマンデーと呼ばれる大暴
て,次の式で定義され’る寄与率がある.
落が含まれていることである(正確には,東京
ろ=1加Σも砺2 (ノ=1,…,の (6)
証券取引所で暴落があったのは第221日目の
砺は因子負荷量行列の要素である(柳井他
10月20日であった).ブラックマンデーでは,
[1990]).さらに次式のように,これ,ら各状態
ほとんどの銘柄が一斉に大暴落という同じ傾向
変数の寄与率を合計したものは累積寄与率と呼
の値動きを示した.従って,その日を解析期間
ばれ,株価の変動を全状態変数でどれだけ説明
に含ぢ場合には銘柄間の相関関係は大きくなり,
することができるかを示す.
その変動が共通因子で表わされるようになる.
R=Σ乳1γゴ (7)
その結果,累積寄与率が大きくなったと考えら
躍7’yモデルでは共通変動要因にのみ時系列
れる.東京証券取引所で大暴落があったのは
構造を仮定し,独自変動要因については雑音と
して扱うため,この累積寄与率の値はモデルの
10月20日の1日だけなのにもかかわらず,そ’
性質を表わす指標の1つとなる.
をおよぼしていることがわかる.
れ,が200日間のデータの解析結果に大きな影響
解析に用いる期間を変化させて因子分析を行
い,累積寄与率を求めた結果を図3に示す.図
3の(a)は表2の銘柄群Aを用いて解析したも
の,(b)は銘柄群Bを用いたものである.実線
(b)時系列次数について
次に,時系列次数についてみる.図4は状態
変数のうち,株価変動に対する影響の大きいも
328
経 済 研 究
図4状態変数の時系列次数
銘柄群Aについて
10
6
一「
、
,4
、し
0
一
、、
2
0
=1 101 201 301 401 501
∼200 −300 ∼400 ∼500 ∼600 ∼700.
1 101
∼200 ∼300
解析期間(通し日数)
@ @\昏\
4
、 、\、、
﹂r’
@ 時系列次数
’
、’
」_弓
o\\、一
,’ノ’
2
V
8
/
舜、、
,’
’
瀦一、ーー
,
’7
時系列次数
6
二藍、レ
P’
一
﹁、
8
4
銘柄群Bについて
10
!
!
201 301 401 501
∼400 ∼500 . ∼600 ∼700
解析期間(通し.日数)
一・o一第1状態変数
「・◆一第2状態変数
図5 トラッキング誤差
1.10
多き
h1・05
一←一カルマンフィルタ使用
.→一MTyモデル
勇藁
→一下変量、4Rモデル
護1.。。
葛。.95
0.90
1 101 . 201 301
401 501
∼200 ∼300 ∼400 ’曽500
∼600 ∼700
解析期間(通し日数)
のから2.つについての時系列次数を示したもの
2状態変数については銘柄群によって多少の違
である.図3と同様2通りの銘柄群についての
いがあり,一概には言えない.この時期は,ブ
結果を示す.実線のグラフは最も寄与率の大き
ラックマンデーと,1989年のバブル経済全盛期
い状態変数(第1状態変数)のもの,点線のグラ
とのちょうど間にあたる.従って,ブラックマ
フは2番目に寄与率の大きい状態変数(第2状
ンデーのショックから証券市場が立ち直って,
態変数)のものである.どちらの銘柄群につい
バブル経済に向けて進んでいこうとする転換期
ても第351日目∼第550日目前後の期間で,第
では,株価変動が強い時系列性を持たずに混沌
1状態変数に時系列構造がな.くなっている.第
としていることがわかる.
カルマ.ンフィルターを用いた株価予測モデルによる株式市場の実証解析 、329
・ (iii)全銘柄に対し,解析期間内のデータにつ
(c)総合的な考察
いて推定した収益率と実際の収益率との差
本モデノレでは,状態変数の時系列構造を解析
を求め,その2乗平均をとる(以下,これ,を
することによって株価変動を把握するため,状
トラッキング誤差と呼ぶ).
態変数のうちでも特に時系列構造を持つものが
という手順で行う.
重要となる.そこで,状態変数のうち時系列構
前節の市場構造についての解析は,時間的な
造を持つものだけによる寄与率を図3に点線で
変動を主眼に置いてあるため,解析期間を細か
示した.これより変動構造は,3つに分類する
く選択し,それぞれに対し2種類の銘柄群につ
ことができる.
いてのみ解析を行ったが,ここでの解析では,
(1)ブラックマンデーの影響を大きく受けて,
時間的な変動よりもむしろ銘柄群の選び方によ
累積寄与率が大きい値を示す期間
る結果の偏りをできるだけなくす事の方が重要
(2)ブラックマンデー後め,本モデルで株価
と考えられるので,100通りの銘柄群を解析し
変動を有効に説明できる割合が少なくな
てトラッキング誤差の平均をとり評価を行った.
、る期間
銘柄群については,223銘柄の銘柄母集団から,
(3)累積寄与率が安定した値を示し;時系列
乱数を用いて100銘柄を無作為抽出する操作を
構造もきちんと捕えることのできる期間
本モデルを将来の株価変動の予測に応用するこ
繰り返して,100通りの銘柄群を構成した.こ
のようにして得られた100通りの銘柄群を以下
とを考えた場合,(1)の期間については,観測し
の解析すべてで用いた.なお∫以下では用いる
た構造がブラックマンデーという特殊な変動に
銘柄群が多いため,計算時間等の制約から解析
大きく影響を受け過ぎているために,.将来の変
期間は100日ずつ移動させての計6期閻につい
動の予測については誤差が大きくなる可能性が
て解析した.
ある.また,(2)の期間については時系列構造
図5は,トラッキング誤差の平均を示したも
1のである.ここでは,収益率を平均値である0
があまり観測できないため予測は困難である.
(3)の期間についてはモデルの予測性能を発揮
と推定したときのトラッキング誤差の平均を1
できると考えられ,今回提案した解法を用いた
として,それとの相対値で示した.比較のため
モデルの精密推定の効果が期待できる.
に,カルマンフィルターを用いない従来の
ル17▽モデルを用いた場合,挙よび各銘柄毎に
3・3 解析期間内のデータの推定
単変量!LRモデルを適用して推定した場合の
今回提案したモデルおよび解法(以下,本手
結果を,従来手法として一緒に示してある.
法と呼ぶ)の株式市場に対する適合度の評価の
また,本手法と従来手法との性能の差を調べ
ために,解析期間内のデータについてモデルに
るために,便宜的に’検定をおこなった.その
基づいて推定しなおし,実際のデータと比較を
ために,本手法でのトラッキング誤差εK礁。。
した.解析は,
と比較モデルのトラッキング誤差を。伽。との差
(i)図2における解析期間のデータを用いて
z=召。饒。r一¢κ。偬。 (8)
モデル構造および状態変数の値を推定する.
を性能の比較尺度として用いる.これを正規分
(ii)推定したモデル構造を用いて,解析期間
布N(μ,σ)に従う確率変数と仮定して,以下の
内のデータを推定する.ま・ず,推定の対象
通りに帰無仮説莇および対立仮説猛を設定
となる日以前の状態変数はわかっているも
する.
のとして(i)の結果を用い,状態方程式か
島:μ=0
{
(9)
私:μ≠0
らその日の状態変数を推定する.その推定
値を用いて観測方程式から収益率を推定す
る.
その時’値は,
330
経 済 研 究 ・
表3 トラッキング誤差についての置検定
解析期間
1 ∼200
芒rモデル
期待値(0)と予測
ARモデル
〃Tyモデル
i従来手法)
47.0
201
101
401
301
@∼300 @∼400
83.3
909
501
@∼500
@∼600
@∼701
9.63
18.4
26.5
一16.1
一11,5
一5.16
一24.4
一13.1
一15.1
5.93
4.82
10.36
5.72
8ユ3
7.30
,一 乏 ’ (10)
ム
翫γ(9)
となる.ここで,2は100回の解析結果の標本
ム
.平均で砲γ(g)は標本分散である.なお,ηは
∬2燃。オ=Aが繊α (12)
予測は解析期間以後3日間,および5日間の
2通りである.その際,実際上は解析期間のデ
ータのみを用いて3日先,5日先まで予測を行
う方が実用的であるが,定常時系列モデルの性
100である.’検定の結果,三無仮説が棄却さ
質により多期間にわたる予測が困難であるため,
れた場合は本手法と従来手法との間に有意な差
予測の対象となるデータ以前のものは,予測期
があると考える.なお,この’検定は,トラッ
間のものであっても既知とし,カルマンフィル
キング誤差の差gが正規分布に従うという仮
ターによる状態変数め補正に用いた.ただし,
定が成立しているかどうかについては検証され,
モデル構造については解析期間内のデータによ
ていないため統計的な厳密さを欠くが,一つの
るものをそのまま用い,状態方程式の係数B
目安として用いた.この検定の結果を表3にま
の更新はおこなっていない.
とめる.それぞれの項目は比較の対象として用
評価は前節の解析期間内のデータの推定の場
いた従来手法である.
合と同じ方法を予測期間に適用して行う.なお,
図5を見てわかる通り,全ての解析期間で本
ここでは前述のトラッキング誤差を予測誤差と
モデルの解析結果はトラッキング誤差がLO未
満の値になっており,収益率を平均値と予測し
呼びかえる.図6は予測誤差の平均を示したも
た場合に比べて株価変動をよく追従しているこ
5日間予測したものを示した.なお,表4は’
とがわかる.また,本手法は,従来の〃Tγモ
検定結果であり,その検定方法はトラッキング
デノレと比べてみても,全ての期間でトラッキン
誤差の場合と同じである.
グ誤差が減少しており,’値からも近似的にで
解析期間が第1日目∼第:200日目,第101日
はあるが有意にカルマンフィルターを用いた反
目∼第300日目,第501日目∼第700日目の3
のである.解析期間後の3日間予測したものと,
復解法の効果が確認された.しかし,各銘柄に
つの解析期間の場合は平均値と予測するよりも
単変量ARモデルを適用した場合した場合に
予測誤差が小さくなっている.しかし,第301
比べると,トラッキング誤差が大きくなってい
日目∼第501日目および第401日目∼第600日
る.これは,状態空間モデルが100銘柄の株価
目の場合は平均値と予測する場合との差はほぼ
変動を5つの状態変数の変動に圧縮しているた
なく,第201日目∼第400日自の場合は明らか
めと考えられる.
に平均値と予測したほう寮予測誤差が小さくな
っている.
3.4予測性能について
この結果を,前述した累積寄与率による市場
次に,モデルの予測性能について評価を行っ
構造の解析結果と合わせて考える.まず,予測
た.予測は,解析期間のデータで推定したモデ
結果が著しく悪くなっている第201日目∼第
ノレ構造を用いて,以下の式に基づいて予測期間
400日目の場合は,解析期間の前半にブラック
のデータ銑を順次予測していく(図2参照).・
マンデーを含み,さらには時系列構造のある成
ガ燃。亡=β尽1 . (11)
分が少ない1988年のデータを解析期間の後半
カルマンフィルターを用いた株価予測モデルによる株式市場の実証解析 331
図6予測誤差
3日先まで予測 5日先まで予測
1.2
U
U
予測誤差の2乗平均
予測誤差の2乗平均
1.2
m
0.9
ω
α9
0.8
0.8
1
101. 201 301 401 501
1
∼200
∼300 ∼400 ∼500 ∼600 ∼700
∼200
101 201 301 401 501
∼300 ∼400 ∼500 ∼600 ∼700
解析期間(通し日数)
解析期間(通し日数)
一←カルマンフィルタ使用
一〇一MτVモデル
ー凸一単変量ARモデル
表4予測誤差についての’検定
解析期間
101
201
301
401
501
@∼300
` 400
@∼500
@∼600
@∼701
8.28
23.9
一9.14
一〇.23
一〇.14
25.6
一〇.99
28.4
一3.61
9.28
0.06
11.3
3.13
2.77
一〇.05
3.44
一〇.23
4.80
7.96
一12.28
一12.48
0.02
一〇.56
18.0
1.68
18.3
一3.86
16.9
1.46
8.02
3.65
0.62
0.12
3.19
0.64
5.19
1 ∼200
芒rモデル
3日間予測
期待値(0)と予測
ARモデル
〃7▽モデル
i従来手法)
5日間予測
期待値(0)と予測
みRモデル
ル17▽モデノレ
i従来手法)
にもっており,予測はその1988年のほぼ真中
きに暗に設定されている
である6月頃について行っている.このように,
(1)株価の変動構造に大きな変化はない
構造解析や予測にとって悪条件が重なった期間
(2)状態変数は状態方程式で表わされるよう
である二とが,ここで予測結果が悪くなった原
な時系列構造を持っている.
因と考えられる.
という仮定を満足していないといえる.その一
その後の第301日目∼第501日目および第
401日目∼第600日目の場合は,その解析期間
方で,予測誤差が小さくなっている期間につい
ては,特殊な株価変動による市場構造の著しい
のほとんどが時系列構造をもった成分が少ない
変化は観測されず,抽出された状態変数につい
1988年のデータである.従って,時系列構造を
てもそのほとんどに時系列構造が観測されて,
もとに予測をおこなう今回の解析ではほとんど
十分越予測可能性を持っていると考えられる.
予測をおこなう余地がないため,期待値と予測
以上は,期待値をそのまま予測値とした場合
する場合と差がなくなったと考えられる.
との比較である.次にその他のモデルとの比較
これらの例は,状態空間モデノレを適用したと
について考察する.同じ状態空間モデルに対し
332 経 済
研 究
てカルマンフィノレターを用いない解法,すなわ
について評価するために,期待値(平均値:こ
ち従来のM7▽で推定した場合と比べると,同
じモデルを用いているため似たような結果とな
こではデータを規格化してあるので0となる)
をそのまま予測値とする場合と比較した.宅の
っているが,カルマンフィルターを用いたほう
結果,解析期間のデータを推定しなおした場合
が,誤差が小さくなる傾向がある.便宜的にお
には,トラッキング誤差が減少しており,モデ
こなった’検定の結果では,第201日目∼第
400日目,第401日目∼第600日目の解析以外
ル設定の効果を確認できた.予測については,
ではほとんど2.0以上の値になっており,近似
ブラックマンデーを解析期間に含んだ場合など
のように解析期間と予測期間の市場構造が大き
的にではあるが有意な差があるといえる.この
く変動していると考えられる時には予測性能が
ことより,カルマンフィルターを用いたことに
悪くなっている.しかし,安定した変動構造を
よってモデル構造をより正確に抽出することが
持ってい・ると考えられる場合については,.モデ
できたと考えることができる.
ルによる予測の効果があることがわかった.
各銘柄に単変量時系列モデルを適用して分析
他のモデルや解法と適合度や予測能力を評価
を行った場合と比較すると,予測誤差の2乗平
した.従来手法による〃Tγモデルと比べ,そ
均は第201日目∼第400日目の解析以外はおお.
の誤差を減少させることができ,近似的にでは
むね減少している.第201日目∼第400日目の
場合は構造の変化が激しいため,状態空間モデ
あるが統計的にも有意であることが確認され,た.
各銘柄に単変量時系列モデルを適用した場合と
ルを適用するより,単純に各銘柄にARモデ
比べると,モデルの適合度については,多数銘
ルを用いたほうが優れ,た結果になるものと思わ
柄の株価変動を少数の状態変数の変動へ圧縮し
れる.’検定の結果をみると,本モデルが有意
たために悪くなっているが,予測については誤
によいといえるのは3つの期間,有意な差があ
差を減少させることができたといえる.
るとはいえないものは2期間,ARモデルの方
がよいと判断されるのは1期間であり,解析期
なお,価格変動とかなり深い関係があるとい
間の状況によって左右されるが,本モデルの方
うことが有効である可能性が高い、これについ
が誤差が小さい場合が多いといえる.、
ては今後の課題であり,現在検討中である.
4.まとめ
われている取引量のデータを考慮した解析を行
付録 カルマンフィルターの導出
カルマンフィルターの導出について概略を説
APT理論に基づいたル1Tyモデルに対し,
明する.観測値銑,状態変数ゐが以下の式に
カルマンフィノレターを応用した反復推定法を提
従うとする.
案し,1987年から1989年の東証1部の株式市
別丁ノ蟻十εオ (A−1)
場についての実証解析を行った.この期間はブ
五=砺_1十力亡 (A−2)
ラックマンデーからバブル経済までを含んだ特
ただし,ノ1はマノレコフ表現によって1階の差分
徴ある期間である.今回のモデノレは,状態変数
式とし,その真の平均ηならびに分散瓦はわ
に時系列構造を仮定しての株価変動の予測が大
かっているものとする.最初に,’=0のときの
きな目的であるため,抽出された状態変数が何
であるかなどについては追及せず,市場構造に
観測値蜘を得たとき,この望め線形演算とし
てあの推定量がを構成するとがは,・
ついての考察は累積寄与率の変動や時系列次数
んR=C必。十4 (A−3)
などでおこなった.それでも,ブラックマンデ
で表わされる.ここで,状態変数んとその推定
ーやその後の混乱,そして再び安定な推移に戻
量乃Rの誤差を
っていく様子をとらえることができた.
召。=.んR一瓢 (A−4)
このモデルを用いての予測を行うことの効果
と定義し,この誤差の期待値E(ε0)が0,分散
カルマンフィルタ』を用いた株価予測モデルによる株式市場の実証解析
333
〃b=E{(θo−E(εo))2}が最小となるようCお
ハ=(〃ε一1十∠4’φ一1/1)}1 (A−12)
よび4を決定する.こととする.この時の推定
ルf亡=(B丑一f1B’十の一1
量が(これを最小二乗推定量と呼ぶ)を計算す
(論文受付.日1993年2月25日,採用決定日
ると
1994年1月12日,日立製作所中央研究所・日
が=鮪+鳥.4の一1価一(A恥十ξo)}
立製作所中央研究所・一橋大学経済学部)
(A−5)
R=(凡}1十/1’φ一1/1)一1 (A−6)
となる..ここで,あならびにξoはそれ,それ期
待値を,凡ならびにφは分散を表わす.ただ
し,ξ。は本文中に示した仮定により0となる.
また,添え字の一1とノはそれぞれ逆行列と転
置行列である.次に,’=1の状態変数五を推
参考文献
[1]Engle R. F. and M. W. Watson(1987),”The
』Kalman filter:applications to forecasting and
rationalexpectations model,” ∠44びαη6θs 伽
E60ηo吻6師。∫Vol.1, T. Bewley ed., Cambridge
定する..んならびにεfがガウス分布に従うと
University Press.
[2] Harvey Andrew C. and Todd(1983),”ForeL
仮定し,蜘が与えられたときの五の条件付き
casting economic time series with structual and
確率密度を計算することによって,観測値鋤
を得たと.きの五の最小二乗推定量は
五lo=βんR十ガ。 (A−7)
となり,そのときの誤差の分散行列は,
ル11=(B、島一1B’十の一1 (A−8)
となることがわかる.ただし,万。=E(η0)は仮
定により0である.
ここで,時刻’=1での観測値銑が得られたと
き五の最小二乗推定量五πは,、蜘および銑が
与えられたときの孟の条件付き確率密度の計
算により,
が一ゐ1。+R/1φ一1{灘1一ノViP}
(A−9)
p1・=〈孤一1十A’φ一1/1)一1. (A−10).
となる.同様の計算を繰り返すことにより,一
般的に次の結果を得る.
が=ノ昂一1+Pレ4φ一1{銑一、4ん一1}
(A−11)
五1亡一1=碑一1
Box−lenkins model:Acase study,”ノ画㎜1(ゾ
.B%s勿θssαη4 Eヒ。ηo吻∫o.S如’ゴ∫距os. Vol.1, PP.299−
315.
[3] Harvey,Andrew C. (1989),押目。αs’勿8
S’剛6’獺♂ π吻θS6ガθ∫.〃04εZs 伽4 漉gK21〃ηη
F臨既Cambridge University Press.
[4]Shiba T. and H. Wago(1989),”Time vary・
ing parameter SUR estlmation Qf a multifactor
asset pricing modeし”7セ。肋加J R砂δκ, University
of Tsukuba.
[5]明田雅昭(1989).「日本株式ファクター・モデ
ルの実証研究」,『証券アナリストジャーナル』,89.2,
7−17.
[6]有本卓(1977).『カルマン・フィルター』,産
業図書.
[7] 刈屋武昭(1986).『計量経済分析の考え方と実
際』,東洋経済新報社.
[8] 刈屋武昭(1990).『金融・証券計量分析の基礎
と応用』,東洋経済新報社.
[9] 深尾光洋(1988).「金融の国際化が為替レート
の変動及び国際収支に与える影響について」,.『金融研
究』,Vo1.7, pp.1−42.
[10] 柳井晴夫,繁桝三男,前川眞一,市川雅教
(1990).r因子分析一その理論と方法一』,朝倉書店.
[11] 山本拓(1988).『経済の時系列分析』,創文社.