1 - cloudfront.net

本書を発行するにあたって、内容に誤りのないようできる限りの注意を払いました
が、本書の内容を適用した結果生じたこと、また、適用できなかった結果について、
著者、出版社とも一切の責任を負いませんのでご了承ください。
本書に掲載されている会社名・製品名は一般に各社の登録商標または商標です。
本書は、「著作権法」によって、著作権等の権利が保護されている著作物です。本
書の複製権・翻訳権・上映権・譲渡権・公衆送信権(送信可能化権を含む)は著作
権者が保有しています。本書の全部または一部につき、無断で転載、複写複製、電
子的装置への入力等をされると、著作権等の権利侵害となる場合があります。また、
代行業者等の第三者によるスキャンやデジタル化は、たとえ個人や家庭内での利用
であっても著作権法上認められておりませんので、ご注意ください。
本書の無断複写は、著作権法上の制限事項を除き、禁じられています。本書の複写
複製を希望される場合は、そのつど事前に下記へ連絡して許諾を得てください。
オーム社開発部「<書名を記載>」係宛、
E-mail([email protected])または書状、FAX(03-3293-2825)にて
まえがき
この本は,私の研究室の歴代の学部学生・修士学生とのゼミを通じて一緒
に勉強・研究したことのまとめである.特に具体的なデータの解析や画像は
彼らの学士論文・修士論文で使われたものを多く利用している.ここに特に
名前(1) を記して感謝したい.地球統計学は最小二乗法という比較的明解でわ
かりやすい手法に基づきながら,さまざまな分野の複雑な実データを解析す
ることを可能にするという点で,学生にも魅力のあるテーマであり,私も含
め楽しみながら研究を行うことができた.
地球統計学の実際の解析には途中で相当の数値計算が必要であり,またし
ばしばマップの形で表現される最終結果のまとめも,もし自分で一からプロ
グラミングすれば相当ハードな作業が必要になる.しかし,オープンソース
の高機能統計解析環境システム R とその地球統計学用のパッケージを用いれ
ば,こうした作業は飛躍的に容易になる.R 自体も高機能なプログラミング
言語でありながら習得は容易であり,ひと通りのプログラミングの学習を過
去に経験している学生であれば,通常私が驚くほど短期間に使いこなすこと
ができる.逆に言えば,この本は R の存在があって初めて書くことができた
本である.R とそのパッケージを無償で開発・保守されている全世界の多く
の人々にも感謝したい.
(1)
杉本将人,本間義之,竹内裕也,臼田憲司,高橋紘士,村山靖洋,持田信行,小林真,濱口卓也,細谷聡君.
iv
まえがき
空間的な広がりを持つデータの蓄積は,時代の必要性と観測機器・体制の
進展に応じ飛躍的に増加しつつあるが,一方で多くの場合比較的わずかな地
点でしか必要な情報が得られないという状況は変わらない.第 13 章で紹介
した幾つかの例からも伺えるように,地球統計学はそうした局所的,散在的
なデータから全体的な情報を推測する強力で便利な手段を提供する.ただし,
地球統計学的な予測の結果はあくまで定常性や特定の共分散,バリオグラム
モデルの仮定の下で初めて妥当性を持つものであり,結果の解釈に当たって
は慎重さが必要である.そうした限界を踏まえた上で空間データのデータ解
析の道具として使うならば,地球統計学は多くの問題を探求するための驚く
ほど柔軟で強力な手段を提供するであろう.
2010 年 11 月
間瀬
茂
目 次
iii
まえがき
第1章
地球統計学とクリギング法
1
第2章
確率場と定常性
5
2.1
確率場 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.2
強定常性
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
2.3
二次定常性
. . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.4
固有定常性
. . . . . . . . . . . . . . . . . . . . . . . . . . .
7
第3章
共分散関数とバリオグラム関数
3.1
共分散関数
3.2
バリオグラム関数
11
. . . . . . . . . . . . . . . . . . . . . . . . . . .
11
. . . . . . . . . . . . . . . . . . . . . . .
12
3.3
等方・異方性 . . . . . . . . . . . . . . . . . . . . . . . . . .
14
3.4
シル,レンジ,ナゲット効果
. . . . . . . . . . . . . . . . .
15
vi
目 次
第4章
4.1
4.2
共分散関数とバリオグラム関数の例
17
一般論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
4.1.1
基本的構成原理 . . . . . . . . . . . . . . . . . . . . .
17
4.1.2
コバリオグラム . . . . . . . . . . . . . . . . . . . . .
19
4.1.3
その他のさまざまな共分散関数の構成・変換法
. . .
20
4.1.4
サポート変換 . . . . . . . . . . . . . . . . . . . . . .
22
. . . . . . . . . . . . . . . . .
24
共分散・バリオグラムモデル
4.2.1
ナゲット効果モデル
. . . . . . . . . . . . . . . . . .
24
4.2.2
球形モデルと関連モデル . . . . . . . . . . . . . . . .
25
4.3
指数モデルと関連モデル . . . . . . . . . . . . . . . . . . . .
27
4.4
ガウスモデルと関連モデル . . . . . . . . . . . . . . . . . . .
28
4.5
Gneiting モデル
. . . . . . . . . . . . . . . . . . . . . . . .
30
4.6
巾乗バリオグラムモデル . . . . . . . . . . . . . . . . . . . .
31
4.7
ホール効果を持つモデル . . . . . . . . . . . . . . . . . . . .
31
4.8
対数関数モデル . . . . . . . . . . . . . . . . . . . . . . . . .
32
4.9
Nested モデル
. . . . . . . . . . . . . . . . . . . . . . . . .
32
第5章
単純・通常クリギング法
33
5.1
単純型クリギング法
. . . . . . . . . . . . . . . . . . . . . .
33
5.2
通常型クリギング法
. . . . . . . . . . . . . . . . . . . . . .
36
第6章
ブロッククリギング法
41
6.1
ブロックデータの共分散 . . . . . . . . . . . . . . . . . . . .
41
6.2
四散化分散と Krige の関係
. . . . . . . . . . . . . . . . . .
42
6.3
ブロック値に対する通常型クリギング法
. . . . . . . . . . .
45
6.4
ブロック値型データを用いたクリギング法
. . . . . . . . . .
47
目 次
第7章
普遍型クリギング法
vii
51
7.1
普遍型クリギング法
7.2
ドリフト係数の普遍型クリギング予測
7.3
. . . . . . . . . . . . . . . . . . . . . .
51
. . . . . . . . . . . .
55
係数の通常の最小二乗法による推定 . . . . . . . . . . . . . .
57
第8章
多変量確率場とクロス共分散,クロス・バリオグラ
ム関数
59
8.1
多変量確率場のクロス共分散関数とクロス・バリオグラム関数
59
8.2
適正なクロス共分散・バリオグラム関数行列 . . . . . . . . .
60
第9章
多変量クリギング法
65
9.1
通常型コクリギング法 . . . . . . . . . . . . . . . . . . . . .
65
9.2
普遍型コクリギング法 . . . . . . . . . . . . . . . . . . . . .
71
9.3
ドリフト係数の推定
. . . . . . . . . . . . . . . . . . . . . .
74
9.4
コロケーテッド・クリギング法
. . . . . . . . . . . . . . . .
75
9.5
外生ドリフト (external drift) 法 . . . . . . . . . . . . . . . .
76
9.6
平行移動不変なドリフト関数系
. . . . . . . . . . . . . . . .
76
第 10 章
交差検証法によるモデル当てはめの良さの検証
77
10.1 クロス・バリデーション法 . . . . . . . . . . . . . . . . . . .
77
10.2 n 重交差検証 (n-fold cross-validation) 法 . . . . . . . . . . .
78
. . . . . . . . . . . . . . . . . . .
79
10.4 平均二乗標準化交差検証予測誤差 . . . . . . . . . . . . . . .
80
10.3 leave-one-out 交差検証法
第 11 章
モデルの当てはめ
83
11.1 バリオグラムモデルを用いたパラメータ推定 . . . . . . . . .
83
11.1.1 通常最小二乗法によるバリオグラム関数の当てはめ .
84
viii
目 次
11.1.2 一般化最小二乗法,重み付き最小二乗法によるバリ
. . . . . . . . . . . . .
85
11.2 最尤推定法による共分散関数モデルの当てはめ . . . . . . . .
86
. . . . . . . . . . . . .
87
11.2.2 制限付き最尤推定 (REML) 法 . . . . . . . . . . . . .
92
11.3 交差検証法によるモデルの当てはめ . . . . . . . . . . . . . .
96
オグラム関数の当てはめ
11.2.1 正規確率場に対する尤度関数
第 12 章
確率場のシミュレーションと条件付きシミュレー
ション
101
12.1 確率場の直接生成法
. . . . . . . . . . . . . . . . . . . . . . 101
12.2 確率場の条件付きシミュレーション . . . . . . . . . . . . . . 102
12.3 離散フーリエ変換による確率場のシミュレーション法 . . . . 105
12.3.1 多重離散フーリエ変換 . . . . . . . . . . . . . . . . . 105
12.3.2 多次元トーラス上の確率場のシミュレーション法
. . 107
12.3.3 離散フーリエ変換による確率場のシミュレーション . 111
12.3.4 FFT アルゴリズム . . . . . . . . . . . . . . . . . . . 113
12.3.5 多変量確率場のシミュレーション例 . . . . . . . . . . 115
第 13 章
クリギング法による解析の実例
13.1 CV 推定法の重金属濃度データへの適用
117
. . . . . . . . . . . 117
13.2 メッシュデータに対する block-to-point クリギング法 . . . . 119
13.3 不規則ブロックに対する block-to-point クリギング予測の例
121
13.4 公示地価データを用いた東京都の地価予測 . . . . . . . . . . 122
13.5 ブロック・クリギング法による大気中の SO2 濃度の解析 . . 127
13.6 階層的ベイズモデルを用いた地震の震度予測 . . . . . . . . . 134
目 次
第 14 章
パッケージ geoR を用いた地球統計学的解析
の実際
ix
143
14.1 クラス geodata のオブジェクト . . . . . . . . . . . . . . . . 145
14.1.1 geodata のオブジェクトへの変換 . . . . . . . . . . . 145
14.1.2 共変量を持つ geodata オブジェクトへの変換
14.2 座標の変換
. . . . 146
. . . . . . . . . . . . . . . . . . . . . . . . . . . 147
. . . . . . . . . . . . . . 147
14.2.1 座標集合の拡大と平行移動
14.2.2 座標集合の非等方的変換 . . . . . . . . . . . . . . . . 147
14.2.3 座標集合の一部分を選択 . . . . . . . . . . . . . . . . 147
14.3 共分散・バリオグラムモデル
. . . . . . . . . . . . . . . . . 149
14.3.1 共分散・バリオグラムモデル
14.3.2 標本バリオグラム
. . . . . . . . . . . . . 149
. . . . . . . . . . . . . . . . . . . 151
14.4 バリオグラムモデルのパラメータの推定
14.5 バリオグラムのエンベロップ
14.6 プロファイル尤度
. . . . . . . . . . . 151
. . . . . . . . . . . . . . . . . 154
. . . . . . . . . . . . . . . . . . . . . . . 155
14.7 クリギング予測 . . . . . . . . . . . . . . . . . . . . . . . . . 156
14.8 平均値関数:普遍型クリギング法,外生ドリフト法
. . . . . 157
14.9 ベイズ推定法 . . . . . . . . . . . . . . . . . . . . . . . . . . 161
14.10 交差検証法
. . . . . . . . . . . . . . . . . . . . . . . . . . 165
14.11 正規確率場のシミュレーション
. . . . . . . . . . . . . . . 166
14.12 二変量正規確率場 . . . . . . . . . . . . . . . . . . . . . . . 167
14.13 Box-Cox 変換 . . . . . . . . . . . . . . . . . . . . . . . . . 168
14.14 ブロッククリギング法
. . . . . . . . . . . . . . . . . . . . 170
14.15 組み込みデータ camg の解析 . . . . . . . . . . . . . . . . . 171
付 録 A
数学的基礎のまとめ
183
A.1 行列,ベクトル . . . . . . . . . . . . . . . . . . . . . . . . . 183
A.1.1 基本的記法 . . . . . . . . . . . . . . . . . . . . . . . 183
A.1.2 正定値,非負定値行列 . . . . . . . . . . . . . . . . . 184
目 次
x
A.1.3 一次形式,二次形式の微分
. . . . . . . . . . . . . . 184
A.1.4 逆行列,行列式の微分 . . . . . . . . . . . . . . . . . 185
A.1.5 一般化逆行列 . . . . . . . . . . . . . . . . . . . . . . 185
A.2 微積分 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
A.2.1 多変数関数の最適化
. . . . . . . . . . . . . . . . . . 186
A.2.2 多変数関数の条件付き最適化,ラグランジュ未定乗数 186
A.3 確率・統計学 . . . . . . . . . . . . . . . . . . . . . . . . . . 187
A.3.1 平均ベクトル,共分散行列
. . . . . . . . . . . . . . 187
A.3.2 多変量正規分布 . . . . . . . . . . . . . . . . . . . . . 188
A.3.3 最尤法
. . . . . . . . . . . . . . . . . . . . . . . . . 188
A.3.4 ベイズ法
. . . . . . . . . . . . . . . . . . . . . . . . 189
A.3.5 モンテカルロ法 . . . . . . . . . . . . . . . . . . . . . 191
A.3.6 MCMC 法
. . . . . . . . . . . . . . . . . . . . . . . 191
A.3.7 階層的ベイズモデル
付 録 B
. . . . . . . . . . . . . . . . . . 194
R の地球統計学用パッケージ gstat と geoR の
主要関数
197
B.1 パッケージ gstat の関数・データセット一覧
. . . . . . . . 197
B.2 パッケージ geoR の関数・データセット一覧 . . . . . . . . . 199
関連図書
205
索引
211
第1章
地球統計学とクリギング法
地球統計学 (Geostatistics) とは,連続な空間的確率現象に対する統計的手法
の一つ(1) である.その自然な数学的枠組みは,d 次元空間 Rd (普通 d = 2, 3)
上の確率場 Z(x) である.空間の特定位置 x1 , x2 , . . . , xn における Z の観測
値 Z(x1 ), Z(x2 ), . . . , Z(xn ) が基本データ型であり,これより確率場の構造
を推測の対象とする.
地球統計学の中心的手法であり,しばしば同義とされるクリギング (Kriging,
kriging) 法は,特に未観測位置 x における確率場の値 Z(x) を予測すること
を目的とする.十分多くの位置で予測を繰り返せば,確率場曲面全体の予測
を行うことが可能になる.したがってクリギング法は,空間的予測・補間法
とも呼ばれる.
地球統計学は最初,鉱山学の手法として誕生した.鉱山学では比較的少数
のボーリング調査結果データから,鉱区全体にわたる鉱物の含有量の分布を
見積もることが必要とされる.かつては例えば鉱区 D をそれぞれボーリン
グ位置 xi を中心に含む小領域 Di に分割し,Di では含有量が一様に Z(xi )
であるとして,全体での含有量を予測する等の素朴な手法が使われていた.
1950 年代初頭,南アフリカの鉱山技師 D. G. Krige と統計学者 H. S. Sichel
は鉱物資源埋蔵量の算出法を改善する目的で,データの持つランダム性,特
(1)
他には空間のランダム位置とそこでの観測値である空間点過程,ランダムな図形を対象にするランダム集
合論に関する統計手法がある.
2
第1章
地球統計学とクリギング法
にその空間的な従属性を考慮することの重要性を指摘し,予測位置までの距
離の逆数で重みを付けたデータの線形結合で予測を行う手法を提案した.
現在知られる形でのクリギング法を定式化したのは,パリ国立高等鉱業
学校(2) (École des Mines de Paris) の数学者であった G. Matheron (Georges
Francois Paul Marie Matheron, 1930–2000) である.確率論の泰斗 P. Lévy の
学生であった Matheron は,確率場の枠組みの下で空間的従属性をバリオグラ
ム関数を用いて表現することにより,観測データの最良線形不偏予測量 (BLUP,
Best Linear Unbiased Predictor) としてのクリギング法の理論を 1960 年前
半に確立した.その際,Krige の先駆的研究を顕彰し「Kriging」という新し
い言葉(3) が造られた.その後 Matheron はパリ国立高等鉱業学校に Centre
de Géostatistique et de Morphologie Mathématique を創設し,自ら創始し
た二つの応用分野である地球統計学と数学的モルフォロジー (mathematical
morphology) 研究の中心とした.このセンターで育った研究者達は所在地に
ちなみ,フォンテンブロー学派と呼ばれる.一方アメリカでは,特に石油探
索への応用を契機とした地球統計学の研究が盛んになった.
クリギング法は Matheron という数学者により基礎理論が構築されたため,
当初より高度な数学的背景を備えており,それが逆に災いしてか必ずしも速
やかに応用分野の研究者に受け入れられたわけではなく,その有用性につい
て激しい議論が交わされた時期があった.他方で,鉱山学という応用分野固
有の手法として誕生し,また初期の研究が統計学の本流から離れたグループ
により行われた(4) という事情から,地球統計学が統計学の自立した内容豊富
な分野として認められるまで相当の時間が必要であった.
現在では,クリギング法は空間データを解析する定石手法の位置を占める
ようになっている.実際,全体を測定するには対象が広すぎ,比較的少数の
点的観測だけから領域全体の様子もしくは平均値を予測せざるを得ないとい
う状況は鉱山学のみならず,多くの分野に共通する.クリギング法は,環境
(2)
グランゼコールと総称されるフランスのエリート教育機関の一つで,ルイ 16 世によりフランス大革命の直
前に鉱山学技術の教育・研究のために創設された.少数精鋭主義の学校で,学生は国家公務員待遇である.
(3)
動詞としては “krige”.フランス語では “krigeage”.クリギング法の歴史については [29] が詳しい.
(4)
こうした事情と,フランス語圏で開発されたという事情からか,地球統計学では統計学標準とは異なる用
語が文献で使われることがある.例えば「確率場」ではなく「確率関数」,
「予測」ではなく「推定」という
用語が標準となっている.
第 1 章 地球統計学とクリギング法
3
問題,生態学,気象学,地理学,経済学,石油・資源探査,土木工学(5) ,農
学,疫学等,数多くの応用分野の必須な手法として位置を占めるようになっ
ている.また,クリギング法はスプライン法と並ぶ空間曲面の補間法とも考
えられ,曲面形状のモデル化にも使われている.
この本は,クリギング法を中心とする地球統計学をできるだけ,しかし過
剰にならぬ程度に厳密に紹介することを目標としている.内容としては地球
統計学の標準的な入門書である [51, 52] と,現在最も広範な内容を持つ [28]
の中間を目指す.
地球統計学の諸手法の適用にあたっては,最終結果のグラフィカルな表示を
含め相当の計算処理が不可欠であり,優れた専用統計ソフトの利用が欠かせ
ない.この本では,近年統計処理ソフトとして全世界的に使われているオー
プンソースの R(6) を用いた具体的な解析法についても紹介する.
R にはユーザが作った特定手法用のプログラムの集まりをパッケージとし
て提供する機構がある.こうした貢献パッケージ (add-on package) と呼ばれ
るプログラム集は通常 R 本体と同様にフリーであり,ネットから自由に入手
でき,R に読み込めば R 本体の機能と区別なく使うことができる.R には
既に空間データを扱うパッケージが幾つも存在し,クリギング法を始めとす
る地球統計学の手法を実装したものも複数ある.この本では特に第 14 章で
geoR と呼ばれるパッケージを用いた実際のデータ処理の手順を紹介する.
このパッケージの基礎になっているパッケージ sp の作者等による解説書 [25]
は R を使った空間データ解析の紹介書である.また [35] は geoR の開発者に
よる解説書である.
(5)
日本における地球統計学の最初の応用は,石油探査と並んで土木工学分野であった.例えば,ダムの建設
では,地盤の強度を予測し,軟弱な箇所には地盤硬化剤を注入する必要がある.トンネルを掘る際にも,常
に次の掘削予定箇所の地質を予測することが必要とされる.
(6)
詳しくは日本の R ユーザが運営するサイト RjpWiki ([19]) を参照.
第2章
確率場と定常性
地球統計学で扱う連続な空間的確率現象に対する自然な数学的枠組みは,
確率場である.ただし,確率場はそれ自体では意味のある構造を持たず,統
計学の基本である同質データの大量観測という状況は,確率場に何らかの定
常性を仮定して初めて可能になる.地球統計学では二次定常性と固有定常性
という二種類の定常性を主に用いる.
クリギング法では未観測位置でのデータ値が,観測位置でのデータとある
確率的相互関係を持つことを大前提にしている.この確率的相互関係は通常
共分散関数もしくはバリオグラム関数を用いて表現される.
2.1
確率場
d 次元空間 Rd の各点 x ごとに確率変数 Z(x) が対応するとき,Z = {Z(x)}
を確率場(1) (random field) と呼ぶ.確率場は非可算個の確率変数の集まりで
あり,R 上の確率変数の集まりである確率過程の多次元径数への拡張と考え
られる.
確率場 Z の確率構造は数学的には,任意個数の位置 x1 , x2 , . . . , xn に対
する確率ベクトル (Z(x1 ), Z(x2 ), . . . , Z(xn )) の n 次元同時分布 Fx1 ,x2 ,...,xn
の全体を与えることで指定される.
(1)
フランス語圏を始めとして確率関数 (random function) と呼ぶ文献もある.
6
第2章
確率場と定常性
任意の有限次元確率分布が多変量正規分布になるとき,Z を正規確率場
(normal random field, Gaussian random field) と呼ぶ.
注意. 逆に有限次元確率分布の族 {FS ; S = ∅, S ⊂ Rd } がある Rd 上の確
率場の有限次元確率分布族になるためには,Kolmogorov の一致性条件:
• S = {x1 , x2 , . . . , xa } ⊂ Rd , S = {xn1 , xn2 , . . . , xnb } ⊂ S ならば
FS は a 次元確率分布 FS の添字 {n1 , n2 , . . . , nb } に対応する b 次
元部分空間への b 次元周辺確率分布
が必要かつ十分である.ただし,確率場のような非可算個の確率変数族をこ
うした有限次元確率分布族から構成する際には,例えば積分
Z(x)dx の
定義可能性等の微妙な数学的問題が生じる.この問題を解決するには Doob
の可分性 (separability) 条件 ([36, T heorem 2.4]) のような付加的仮定が必
要になる.これは簡単に言えば,Z(x) 全体の値が可算個の位置の値だけか
らある意味で決定できることを要求する.一般に有限次元確率分布族を変
更することなく可分な確率場を構成できるが,例えば,すべての Z(x) が
互いに独立であるような極端な確率場は合理的には考えることができない.
注意. 以下では x ∈ Rd を特に区別なしに「点」もしくは「位置」と呼ぶ.
位置 x に対応する確率変数 Z(x) の実現値が観測値・データである.
2.2
強定常性
確率場 Z が強定常 (strongly stationary) であるとは,任意のベクトル h
で Z を平行移動した確率場 {Z(x + h)} の確率分布が {Z(x)} と同一であ
ることをいう.確率場の確率分布が「座標の原点の取り方に依存しない」と
表現することもできる.強定常性はそのものとしては非常に制約的な仮定で
あり現実的ではない.重要な例外として正規確率場がある.正規確率場の確
率構造は平均と共分散のみで決まるため,次に述べる二次定常性が成り立て
ば,自動的に強定常になる.
Rd の任意の回転 A に対して AZ の確率分布が不変なとき,Z は等方的
(isotropic) な確率場と呼ばれる.
2.3 二次定常性
2.3
7
二次定常性
任意の位置 x で平均値 m(x) = E Z(x) が存在するとき,関数 m(x)
を確率場のドリフト(傾向,drift)と呼ぶ.さらに E |Z(x)|2 が常に有限
のとき二次の確率場 (second-order random field) と呼ぶ.このとき共分散
C(x, y) = C{Z(x), Z(y)} を定義することができる.
定義 2.1. 二次の確率場 {Z(x)} が次の二つの性質を持つとき,二次定常
(second-order stationary) であるという:
1. ドリフト関数は定数値 m(x) = m,
2. 共分散 C(x, y) は x − y のみに依存する.
位置の差分 h = x − y のみに依存する関数
C(h) = C{Z(x + h), Z(x)} = E [Z(x + h) − m][Z(x) − m]
(2.1)
を二次定常確率場の共分散関数 (covariance function) と呼ぶ.
2.4
固有定常性
定義 2.2. 任意の二点 x, y に対する確率場の差分 Z(x) − Z(y) が以下の
二つの性質を持つとき,確率場 Z は固有定常(2) (intrinsic stationary) である
という:
1. E[Z(x)−Z(y)] = 0,
2. V {Z(x)−Z(y)} = E |Z(x)−Z(y)|2 が x−y のみに依存する.
位置の差分 h = x − y のみに依存する関数
γ(h) = 12 E|Z(x + h)−Z(x)|2
(2)
(2.2)
英語「intrinsic」の主要な訳には,1) 固有の,2) 本質的な,3) 内在する,の三つがある.文献 [17] で
は「本質的」,文献 [51] では「固有」の訳を当ててある.この本では「固有」と訳すことにする.しかし
ながら,intrinsic stationarity は差分を取ることにより初めて表面化する内部的な定常性であり,
「内在
的」と訳すのがより適切であるかもしれない.
8
第2章
確率場と定常性
を固有定常確率場のバリオグラム関数 (variogram function)(3) と呼ぶ.定義か
らバリオグラム関数は性質 γ(0) = 0, γ(h) ≥ 0 そして対称性 γ(−h) = γ(h)
を持つ.
定理 2.1. 確率場が二次定常ならば固有定常でもあり,バリオグラム関数
と共分散関数が同時に考えられる.両者の間には以下の関係が成り立つ:
γ(h) = C(0) − C(h),
特に γ(h) ≤ 2C(0).
(2.3)
逆にバリオグラム関数が極限 b = lim|h|→∞ γ(h) を持てば,関係 (2.3) が成
り立つ共分散関数 C(h) が存在する.
[証明]関係 (2.3) は次の関係式から分かる:
2γ(h) = E |Z(x + h) − Z(x)|2
= E |[Z(x + h) − m] − [Z(x) − m]|2
= V {Z(x + h)} + V {Z(x)} − 2C{Z(x + h), Z(x)}.
任意の実数列 w1 , w2 , . . . , wn に対し w0 = −
n
i=1
wi と置き,x0 を適当な
点とすれば
0≤−
n n
wi wj γ(xi −xj ) = −
i=0 j=0
n n
wi wj γ(xi −xj )
i=1 j=1
− 2w0
n
wj γ(xj −x0 )
j=1
である.ここで |x0 | → ∞ とすれば
0≤−
n n
i=1 j=1
wi wj γ(xi −xj ) + 2bw02 =
n n
wi wj [2b − γ(xi −xj )]
i=1 j=1
であるから C(h) = 2b − γ(h) は共分散関数であり (2.3) が成り立つ.
(3)
因子 1
2 を付けるのは,関連する式が簡単になるためであり,この因子を付けない定義と区別するためにセ
ミバリオグラム (semi-variogram) と呼ぶことがある.
2.4 固有定常性
9
注意. 固有定常性は必ずしも有限な期待値 EZ(x), EZ 2 (x) の存在を仮
定していないことを注意しよう.特に仮定 E[Z(x)−Z(y)] = 0 は一般に
は EZ(x) = EZ(y) と同値ではない.
注意. 固有定常であるが二次定常ではない自明な例としては,Z を二次定常
確率場,X を平均が存在しない確率変数として Y (x) = Z(x)+X と置いたも
のがある.E Y (x) は存在しない一方,Y と Z のバリオグラム関数は一致す
る.自明ではない有名な例として Lévy のブラウン運動 B(x) がある ([39]).
Lévy のブラウン運動は性質 EB(x) = 0, B(0) = 0, E|B(x) − B(y)|2 =
1
2 (
x
+ y
− x − y
)
= 12 x−y
であり,した
x − y
を持つ正規確率場である.共分散関数は
であり二次定常ではない.バリオグラムは γ(h)
がって固有定常である.
注意. 条件付き非正定値関数 γ(h), γ(0) = 0, に対し,それをバリオグラ
ム関数に持つ正規固有定常確率場を構成することができる.したがって固
有定常確率場のバリオグラム関数と条件付き非正定値関数は本質的に同等
の存在であり,以下では同じ意味で使う.
第3章
共分散関数と
バリオグラム関数
クリギング法では未観測位置でのデータ値が,観測位置でのデータとある
確率的相互関係を持つことを大前提にしている.この確率的相互関係は通
常共分散関数 (covariance function),もしくはバリオグラム関数 (variogram
function) で指定される.
3.1
共分散関数
共分散関数は二次定常確率場の空間的依存性を特徴づける基本特性量で,
C(x−y) = C{Z(x), Z(y)}
(3.1)
で定義される関数である.二次定常性の仮定から共分散関数は位置 x, y の
差分 h = x − y のみに依存する.普通,共分散関数は減少関数であり,また
lim|h|→+∞ C(h) = 0 となることが多い.
共分散関数は,対称 C(−h) = C(h) かつ有界 |C(h)| ≤ C(0) であり,特
に C(0) = V {Z(x)} は非負である.実際,期待値に対するシュワルツの不
等式より
|C(h)|2 = |E[Z(x)−m][Z(y)−m]|2
≤ E|Z(x)−m|2 E|Z(y)−m|2 = C 2 (0).
12
第 3 章 共分散関数とバリオグラム関数
共分散関数を特徴づける重要な性質(1) は非負定値 (non-negative definite)
性:任意の実数列 w1 , w2 , . . . , wn ,点列 x1 , x2 , . . . , xn で
n n
wi wj C(xi −xj ) ≥ 0
(3.2)
i=1 j=1
である.実際 (3.2) の左辺の和は期待値 E|
i
wi Z(xi )|2 に等しく,したがっ
て非負である.ここで特に (3.2) 式で等号が成立すればすべての wi = 0 で
あるとき,正定値 (positive definite) と呼ぶ(2) .
共分散関数の正定値・非負定値性は対応する行列 {C(xi −xj )}1≤i,j≤n が
正定値・非負定値であることを意味する.
3.2
バリオグラム関数
バリオグラム関数は固有定常確率場の空間的依存性を特徴づける基本特性
量で
γ(h) = 12 E|Z(x) − Z(y)|2
(3.3)
で定義される関数である.固有定常性の仮定から共分散関数は位置 x, y の
差分 h = x − y のみに依存する.バリオグラム関数は常に非負値,対称
γ(−h) = γ(h) であり,特に γ(0) = 0 である.共分散関数と異なり,バリオ
グラム関数は必ずしも有界とは限らない.普通増加関数である.
バリオグラム関数の特徴的な性質(3) は γ(h) の条件付き非正定値 (condi-
tional non-positive definite) 性:総和が 0 である任意の実数列 w1 , w2 , . . . , wn ,
点列 x1 , x2 , . . . , xn で
n n
wi wj γ(xi −xj ) ≤ 0
(3.4)
i=1 j=1
(1)
実は正定値共分散関数 C(h) に対し,それを共分散関数に持つ二次定常正規確率場 Z を常に構成できる
ことが知られている.したがって正定値共分散関数と二次定常確率場は数学的には同等の存在であるとい
うことができる.
(2)
(3.2) 式で等号が成立すれば線形関係
i wi Z(xi ) ≡ 0 が確率 1 で成り立つということを意味し,した
がって「病的な」確率場を除けば,共分散関数は正定値であることを注意しよう.
(3)
γ(h) が条件付き負定値関数ならば,γ(h) をバリオグラム関数に持つ固有定常正規確率場 Z を構成でき
ることが知られている.したがって条件付き負定値関数と固有定常確率場は数学的には同等の存在である
ということができる.
3.2 バリオグラム関数
である.実際
n
n
wi =
i=1
j=1
13
vj = 0 であれば,w を適当な点とし Y (x) =
Z(x) − Z(w) すると |Z(xi ) − Z(y j )|2 = |Y (xi )|2 + |Y (y j )|2 − 2Y (xi )Y (y j )
であるから
EY (xi )Y (y j ) = −γ(xi −y j ) + γ(xi −w) + γ(y j −w).
この等式と関係
i
wi Z(xi ) =
i
wi Y (xi ),
j
vj Z(y j ) =
(3.5)
j
vj Y (y j )
より
C
i
=
wi Z(xi ),
i
=−
j
wi vj EY (xi )Y (y j )
j
i
+
wi vj γ(xi −y j ) +
j
wi
i
=−
vj Z(y j )
n n
vj
j
wi γ(xi −z)
i
vj γ(y j −z)
j
wi vj γ(xi −y j )
i=1 j=1
wi wj γ(xi −xj ) = V { i wi Z(xi )} ≥ 0 となる.ま
た i j wi wj γ(xi −xj ) = 0 ならば,線形関係 i wi Z(xi ) ≡ 0 が確率 1
となる.特に −
i
j
で成り立つ.したがって特別な確率場を除き,wi ≡ 0 となることを注意し
よう.つまり γ(h) は通常条件付き負定値 (conditional negative definite) で
ある.
もし確率場が二次定常ならば固有定常でもあり,バリオグラム関数と共分
散関数が同時に考えられる.このとき,次の関係 (3.6) が成り立つ.
γ(h) = C(0) − C(h).
(3.6)
特に γ(h) ≤ 2C(0) となる.
注意. (3.4) で等号が成り立てば,線形関係
i
wi Z(xi ) ≡ 0 が確率 1 で
成り立つ.したがって特別な確率場を除き wi ≡ 0 となることを注意しよう.
14
第 3 章 共分散関数とバリオグラム関数
つまり「通常」バリオグラム関数は条件付き負定値 (conditional negative
definite) 関数である.
等方・異方性
3.3
共分散・バリオグラム関数の値が差分ベクトル h の大きさ |h| だけで決
まるとき,等方的 (isotropic) と呼ばれる.h の方向にも依存するとき異方的
(anisotropic) と呼ばれる.等方的な確率場の共分散・バリオグラム関数は等
方的になる.行列 A が空間の回転と主軸の拡大・縮小を合成したものである
とき,等方的な共分散関数 C0 (バリオグラム関数 γ0 )を用いて構成される
C(h) = C0 (|Ah|)
(γ(h) = γ0 (|Ah|))
の形の異方的共分散関数 C(バリオグラム関数 γ )は,幾何的異方性 (geometric
anisotropy) を持つといわれる.C(x) の等高線は同心楕円(体)になる.A
の一般型は二次元なら x, y 軸方向の拡大・縮小率 r1 , r2 > 0 と一つの回転角
θ を用いて
r1
0
0
r2
cos θ
sin θ
− sin θ
cos θ
であり,三次元なら x, y, z 軸方向の拡大・縮小率 r1 , r2 , r3 > 0 と三つの回
転角(いわゆるオイラー角)θ1 , θ2 .θ3 を用いて(4) ,例えば
r1
0
0
0
r2
0
0
0
r3
cos θ3
− sin θ3
0
sin θ3
cos θ3
0
0
0
1
1
0
0
0
cos θ2
− sin θ2
0
sin θ2
cos θ2
cos θ1
− sin θ1
0
sin θ1
cos θ1
0
0
0
1
となる.
(4)
z 軸回りに角度 θ1 だけ回転し,次に新しい x 軸回りに角度 θ2 だけ回転し,最後にさらに新しい z 軸
回りに角度 θ3 だけ回転する.
3.4 シル,レンジ,ナゲット効果
3.4
15
シル,レンジ,ナゲット効果
共分散・バリオグラム関数の当てはめの際に考慮すべき,いくつかの形状
的特徴がある.
• ある距離 r があり |h| ≥ r ならば,γ(h) = maxx γ(x) であるとき,
そうした r(の最小値)をレンジ (range) と呼ぶ.共分散関数も存在
し lim|h|→+∞ C(h) = 0 であれば,関係 (3.6) より,これは |h| ≥ c
で C(h) = 0 と同じことである.
• c をレンジとするとき,γ(c) = maxx γ(x) をシル (sill)(5) と呼ぶ.共
分散関数が存在し,lim|h| C(h) = 0 であれば,シルは C(0) と等しく
なる.
• バリオグラム関数が原点 0 で不連続でジャンプ lim|h|↓+0 γ(h) > 0 を
持つとき,ナゲット効果 (nugget effect)(6) を持つという.共分散関数
が存在すれば,共分散関数が原点でジャンプを持つことと同じことで
ある.
• 共分散・バリオグラム関数が波状の振幅を持つことをホール効果 (hole
effect) という.特定の周期的構造を示唆する.
• 異方的な共分散・バリオグラム関数が方向により収束する距離が大き
く異なることを層状異方性 (zonal anisotropy) という.例えば地層方
向と鉛直方向では共分散・バリオグラム関数が収束する距離が大きく
異なる可能性がある.
(5)
シルとは「窓・戸などの敷居」,地学用語では「地層面に平行な板状貫入岩体」の意味である.レンジ距離
を超えるとグラフが水平になることの比喩的表現らしい.
(6)
ナゲットとは鉱物の塊(特に金塊)を意味する.ナゲット効果はある位置固有で互いに独立な白色雑音と
解釈されることが多い.偶々ナゲットがあれば,その位置の観測値が極端に増加することから命名された
らしい.
第4章
共分散関数と
バリオグラム関数の例
この章では共分散・バリオグラム関数の例を紹介する.多くは等方的な例
である.既に述べたように,有界な場合には共分散関数とバリオグラム関数
の間には簡単な関係 γ(h) = C(0) − C(h) があるため,どちらかを考えれば
良い.
4.1
一般論
共分散・バリオグラム関数はそれぞれ正(非負)定値・条件付き負(非正)
定値性という性質を持つため,可能な形には強い制限がある.この節では,共
分散・バリオグラム関数を構成するための一般論を紹介する.
4.1.1
基本的構成原理
定理 4.1. (Bochner の定理) Rd 上の実連続関数 C(h) が正定値であるた
めの必要十分条件は,それが Rd 上の有界対称正測度 μ のフーリエ変換とし
て表せることである:
C(h) =
e2π
√
−1 h·x
dμ(x)
ここで h·x は h と x の内積を表す.特に C(0) =
(4.1)
dμ(x) である.
18
第 4 章 共分散関数とバリオグラム関数の例
μ の対称性から
cos(2π h·x)dμ(x)
C(h) =
であり,C は実数値関数になる.(4.1) が十分条件であることは次の等式
i,j
2
√
2π −1 xi ·x wi wj C(h) = wi e
dμ(x)
i
から分かる.特に,非負値偶関数 f (x) が可積分であれば,そのフーリエ変換
e2π
C(x) =
√
−1 x·y
f (y)dy
は共分散関数となる.f (y) を C(x) のスペクトル密度関数と呼ぶ.次のよ
うな,この結果の部分的な逆が成立することがフーリエ変換論の結果から分
かる.
定理 4.2. (共分散関数のスペクトル密度関数) (1)
|C(x)|dx < ∞ であ
れば C(h) のスペクトル密度関数は逆フーリエ変換
f (y) =
√
−2π −1 y·x
e
C(x)dx =
cos(2π y·x)C(x)dx
で与えられる.
(2) Rd 上の等方的な共分散関数のスペクトル密度関数はやはり等方的であり,
次のような次数 d の Hankel 変換で対応する:
1−d/2
∞
fd (ρ) = 2πρ
0
Cd (r) = 2πr1−d/2
∞
rd/2 Jd/2−1 (2πρr)Cd (r)dr,
ρd/2 Jd/2−1 (2πρr)fd (ρ)dρ
0
ここで Jν は次数 ν の第一種ベッセル関数である.
定理 4.3. (Schoenberg・von Neumann の定理) γ(0) = 0 である Rd 上の
実連続関数 γ(h) に対して次の三条件は同値である:(1) γ(h) はバリオグラ
4.1 一般論
19
ム関数,
(2) すべての t > 0 で e−tγ(h) は正定値関数,
(3) γ(h) は次の表現を持つ:
1 − cos(2π h·y)
γ(h) =
dμ(y)
4π 2 |y|2
(4.2)
ここで μ は μ({0}) = 0 である対称な正測度で
1
dμ(y) < ∞.
1 + 4π 2 |y|2
実際 (4.2) の形の関数が条件付き非正定値関数になることは次の関係から
分かる:
2
i
wi = 0 ならば
wi wj [1−cos(2π (xi − xj )·y)]
i,j
=
wi wj [2−e−2π
√
−1 (xi −xj )·y
−e2π
√
−1 (xi −xj )·y
]
i,j
2 2 √
−2π√−1 x ·y 2
i
wi − e2π −1 xi ·y − e
=2
i
i
i
2 2
√
√
2π −1 xi ·y −2π −1 xi ·y = −
e
e
−
i
i
≤ 0.
4.1.2
コバリオグラム
定理 4.4. 0 <
|f (t)|2 dt < ∞ である Rm 上の関数 f (x) のコバリオグ
ラム (covariogram)
C(h) =
f (t−h)f (t)dt =
fˇ(h−t)f (t)dt = (fˇ ∗ f )(h)
は共分散関数である.ここで fˇ(t) = f (−t) で fˇ ∗ f は畳み込みである.も
しある R > 0 があり |x| > R では f (x) = 0 ならば |h| > 2R で C(h) = 0
20
第 4 章 共分散関数とバリオグラム関数の例
となる.C(h) のラドン変換
D(h1 , h2 . . . . , hm−1 ) =
C(h1 , h2 . . . . , hm−1 , hm )dhm
は f (t) のラドン変換
g(t1 , t2 . . . . , tm−1 ) =
を用いて D(h ) =
f (t1 , t2 . . . . , tm−1 , tm )dtm
g(t −h )g(t )dt と表せ,したがって Rm−1 上の共分
散関数である.
[証明]C(x−y) =
i,j
f (t−x)f (t−y)dt であるから
wi wj C(xi −xj ) =
2
w
f
(t−x
)
i
i dt ≥ 0
i
である.二つ目の主張は,|t| ≤ R かつ |t−h| ≤ R ならば |h| ≤ 2R である
ことから分かる.また最後の主張は次の関係から分かる:
C(h1 , . . . , hm−1 , hm )dhm
= dhm f (t1 −h1 , . . . , tm−1 −hm−1 , tm −hm )
=
× f (t1 , . . . , tm−1 , tm )dt1 ·sdtm−1 dtm
dt1 ·sdtm−1
f (t1 −h1 , . . . , tm−1 −hm−1 , a)da
×
f (t1 −h1 , . . . , tm−1 −hm−1 , b)db
=
4.1.3
g(t1 −h1 , . . . , tm−1 −hm−1 )g(t1 , . . . , tm−1 )dt1 · · ·dtm−1 .
その他のさまざまな共分散関数の構成・変換法
定理 4.5.
(1) C(x) が共分散関数ならば,a + b C(x) (a ≥ 0, b > 0) も共分散関数.