状態空間モデルを用いた金融 時系列分析

9月26日CARFセミナー
状態空間モデルを用いた金融
時系列分析
佐藤整尚
(大学共同利用機関法人・情報・システム研究機構
統計数理研究所・データ科学研究系・准教授)
はじめに
• 90年代:統計科学の分野で金融データに対する応
用が盛んになった:ARCH、GARCHをはじめとする
ボラティリティモデルの推定
• 2000年以降:さまざまな商品が開発される。高頻度
データの解析、債券価格のモデリング、倒産確率の
モデリング
• 現在:数理ファイナンスの進化が著しい。
(統計科学の出番は?)
状態(State)変数とは
• 必ずしも観測されるとは限らない物事の状態
(本質)を表す変数。
• 時間とともに変動する。
• 観測値は状態変数の関数で表される。
状態空間モデルとは
• システムモデル(状態モデル)と観測モデル
からなる。
• システムモデルにはマルコフ性が仮定される。
システムモデル
t-1時点の状態
t時点の状態
観測モデル
t-1時点の観測値
t+1時点の状態
観測モデル
t時点の観測値
t+1時点の観測値
状態空間モデル
• 線形・ガウスの場合(xが状態変数)
例)
xt = Fxt −1 + Gvt
(システムモデル)
yt = Hxt + et
(観測モデル)
β t = β t −1 + ε t
yt = β t xt + et
(システムモデル)
(観測モデル)
カルマン・フィルタ
一般化状態空間モデル
(Yが状態変数)
システムモデル
観測モデル
状態空間モデルの目的
• モデルの当てはめやパラメータの推定を行う。
• 観測値から状態変数を推定する。
• モデルに基づき予測を行う。
• モデルに基づき平滑化を行う。
状態空間モデルの歴史
• もともとは物理システムの記述
に使われていた。
• 1960年代カルマンにより、制御
工学での利用が進んだ。(カル
マンフィルタ)
• 1970年代赤池により、統計科学
への応用が始まる。
理論モデルの記述
*ファイナンスでも使われる
ようになってきた。
システムの制御
モデルの推定
金融時系列分析において
状態空間モデルが有効な例
•
•
•
•
•
•
•
Trend Modelの推定
Volatilityの推定( Stochastic Volatility Model )
金利の期間構造の推定
マルチファクターモデルの推定
CAPMにおける時変Betaの推定
投資信託のスタイル分析
マイクロマーケットストラクチャーの推定
金融時系列において状態空間モデル
が適用される時の2つの傾向
• 理論モデルの対象とする変数が観測できない場合
– 数理ファイナンスを起源とするモデル(連続時間モデル)
– 状態(システム)モデルは一般に複雑である。非線形でカ
ルマンフィルターでは解けないことも多い。
• 時変係数タイプの非定常モデル
– クオンツタイプのモデル
– ベースは回帰モデルでこれを時変にしたもの
– システムモデルは統計的なモデリングである。カルマン
フィルタで解ける場合が多い。
状態推定のアルゴリズム
•
•
•
•
カルマン・フィルタ
拡張カルマン・フィルタ
非線形フィルタ
モンテカルロ・フィルタ
モンテカルロフィルタの特徴
• 様々なモデルに適用可能である.
– 制約つき推定
– 非線形構造
– 突然のジャンプなどを含むモデル
• 状態変数(潜在変数)の推定が得意
• 平滑化も可能である.
Monte Carlo Filter
: ( Kitagawa [1996] )
Initial distribution
Prediction
~
likelihood
Re-sampling by
Filter
Log-Likelihood
AIC (Akaike Information Criterion)
Trend-Volatility
model (summary)
Yt = Tt + At + ε t
exp S t
Tt = DTt – 1 + Tt – 1 + e 1t + e 2t
(状態:トレンド、
ボラティリティ、周期変動)
DTt = DTt – 1 + e 1t
At = a 1 At – 1 + a 2 At – 2 + e 3t
S t = S t – 1 + c ∆DT t – 1 + e 4t
e 1t,e 3t,e 4t ~ N 0,σ 2i , ε t ~ N 0,1
e2 ~
Uniform(d 1 , d 2) (Prob. α)
N(0,σ 22)
(Prob. 1 – α)
時変係数マルチファクターモデル
(状態:ファクターにかかる係数)
at = at −1 + v1t

bt = bt −1 + v2t
c = c + v
3t
t −1
 t
 r1t = at + bt f (1)1t + ct f1(t 2 ) + e1t

(1)
( 2)
r
a
b
f
c
f
=
+
+
2
2 t + e2 t
t
 2t
t
t
t



 rnt = at + bt f (1) nt + ct f ( 2 ) nt + ent
時変係数CAPM
Multi-Factor Model
Observational Data (interest rates)
•State Space Model
(状態:ファクター)
•Monte Carlo Filter
Estimated Factors (State Variables)
Estimated
Term Structure
ファイナンス理論によるモデリング(一般的な枠組み)
Term structure model of interest rates
State variables: Y (k-dimensional)
W : n dimensional Brownian motion
Short-term interest rate :
r = r (Y , t )
Price of zero coupon bonds : P(t,T)
PはYのモデルの形に
依存して決定される
Q : Risk neutral measure
T : maturity
∴ P (t , T ) = B (Y (t ), t , T )
Under Q
*
*
System Model:
General case :
Linear case :
Σ = SS ′
Observational Model
Price of a zero coupon bond
| Y (t )]
= B (Y (t ); t , T )
General case :
Additive case :
Examples of H(・ ) :
(LIBOR)
(Swap rate)
要点:
モンテカルロフィルターを用いた金利の期間構造の推定
特徴: 幅広いモデルに適用可能である.
特にゼロクーポン債の価格が明示的
に解けなくてもよい.
自由なモデリングが可能
(CIRなどのモデルにこだわる必要が無い)
スタイル分析法
• 静的枠組み
– 回帰モデル
• 動的枠組み
– ウィンドウを移動しながら回帰を行う方法
– 罰金つき最小2乗法
– ・・・
– 状態空間表現によるアプローチ(新しい手法)
投資信託のスタイル分析
(状態:スタイルインデックスにかかる係数)
rt = β1t SVt + β 2t SGt + β 3t MVt
+ β 4t MGt + β 5t LVt + β 6t LGt + et
SV:Small-Value
MV:Mid-Value
LV:Large-Value
SG:Small-Growth
MG:Mid-Growth
LG:Large-Growth
従来の方法
• Window-Regressionによって求めた係数を
平滑化する方法
(MPI-スタイラス,http://www.mpi-japan.com/)
• 制約つき最小2乗法+HP Filter
(竹原1999)
ここで提案する方法:
Smoothness Prior + Monte Carlo Filter
rt = β1t SVt + β 2t SGt + β 3t MVt + β 4t MGt + β 5t LVt + β 6t LGt + et
モデル:
β it = β i ,t −1 + ε it
 N (0, σ i2 )
ε it ~ 
2
 N (0, cσ i )
β it ≥ 0
(Pr : α )
(Pr : 1 − α )
(1)
制約:
∑β
it
≤1
(2)
β i 't = 1 − ∑ β jt
j ≠i '
(3)
β1t = 1 − ∑ β jt
1
(Pr : )
6
β 2t = 1 − ∑ β jt
1
(Pr : )
6
j ≠1
j≠2

β 6t = 1 − ∑ β jt
j ≠6
1
(Pr : )
6
状態推定はモンテカルロフィルター
を使う.
実証結果のまとめ
• ウエイト所与のもとでのシミュレーションデー
タに対してはよく推定されている.
• 特にMCFでは急激な変化も捉えられた.
• 現実のリターン系列に対しては必ずしも満足
できる結果ではない.
– 現実のファンドは常にスタイルインデックスのみ
のポートフォリオとしてみれるか?
ボラティリティの推定
• ヒストリカルボラティリティ
• SVやGARCHなどのモデルを使った推定
• 高頻度データを使った実現ボラティリティの推定
日次データ -> 1分データ、1秒データ、
Tick データ
*より精緻にVolatilityの推定が可能
High Frequency Data of Nikkei-225 Futures
Apr-16-2007
• Traded at Osaka
Securites Exchange
• Very active
– Daily average volume
136,802 units (2008)
• Intra-day volatility
movements
• Large tick size
– 10 yen
(Spot index : 0.01 yen)
*Futures data are presented by Osaka Securities Exchange.
High Frequency Data
Apr-16-2007
Spot index (black) and Futures (red)
60 sec.
Historical Integrated Volatility for Nikei225 Futures
Integrated
Volatility
(1s)
n
Σˆ x = ∑ ( xi / n − x( i −1) / n ) 2
i =1
(5s)
(10s)
(30s)
X:LOGをとった株価
Interval
X: log transformed
stock price
従来のフレームワーク
(状態:本源的な資産価格、
ただし、状態そのものを推定
するのではない)
xi = xi −1 + ei
Discrete model:
yi = xi + vi
高頻度データに対する
より一般的な枠組み
t
xt = x0 + ∫ Σ
0
1/ 2
x
( s ) dBs
yti = g ( xti , yti−1 , vti )
観測値yからxのボラティリティを推定する。
(0 ≤ t ≤ 1)
SIML (Separating Information
Maximum Likelihood) Estimator
(Proposed by Kunitomo and Sato (2008))
Pn: rotation matrix
For small k,
an ,k = 4n sin 2 [π2 ( 22 nk +−11 )] ≅ 0
z1 , z 2 ,  , z m ,  , z n −l +1 , z n −l + 2 ,  , z n




↓
ˆ
Σ
x
↓
ˆ
Σ
v
SIMLの特徴
• 実務的な方法である。
– 計算が簡単であり、他の方法のようにデータごと
に定めるパラメータなどがない。
– やや効率性は落ちるが、非常にロバストである。
• 漸近的な性質が比較的簡単である。
• 共分散も推定できるので、たとえば、重回帰
モデルの推定なども可能である。
高頻度データに対する
新しい観測モデル
t
xt = x0 + ∫ Σ
0
1/ 2
x
( s ) dBs
∆yti = g ( xti − yti−1 ) + vti
観測値yからxのボラティリティを推定する。
(0 ≤ t ≤ 1)
まとめ
• 高頻度データの観測モデルを非線形に拡張した。
• さまざまな非線形変換が考えられる。
• 従来の加法ノイズモデルにおける実現分散の推定
法も、ほぼ、有効である。
• 多変量のケースでの実現相関の推定も可能
(SIML)
ファイナンス分野での統計科学
• 統計モデル(時系列モデル)のファイナンス
データへの適用
• ファイナンスモデルへの統計手法の適用
• 状態空間モデルは両方をつなぐ接点となりう
る。
– 新しいフィルタリングの応用
– 今まで推定の難しかったファイナンスモデルの推
定