全 文 - terrapub

日本統計学会誌
第 39 巻, 第 1 号, 2009 年 9 月
137 頁 ∼ 159 頁
計算代数統計の最近の話題について
竹村 彰通∗†
Some Recent Topics from Computational Algebraic Statistics
Akimichi Takemura∗†
本稿では計算代数統計で扱われる問題について,簡単な例題などを用いて紹介するとともに,
筆者及び共同研究者の最近の研究成果の一部を紹介する.
In this paper we discuss recent topics from computational algebraic statistics, by considering
some simple examples. We also present some recent results by the author and coauthors.
キーワード: 分割表,一部実施要因計画,グレブナー基底,マルコフ基底
はじめに
1.
計算代数統計にかかわるようになってからすでに 10 年近い時間がたった.そのきっかけ
は 2001 年の春頃に Diaconis-Sturmfels の論文 (Diaconis and Sturmfels (1998)) のグレブ
ナー基底,特に 3 × 3 × 3 分割表の無 3 因子交互作用モデルの正確検定のためのグレブナー
基底の形について,青木敏君から説明を受けて不思議な印象があり,考え始めたという偶然
的なものであった.その後,マルコフ基底の構造などについて青木敏君と若干の結果を得
て発表するにつれて,アメリカでの研究集会に参加したり,また我が国のグレブナー基底
研究の最先端を担っておられる日比孝之氏・大杉英史氏との交流も始まるなど,研究の視
野が広がっていった.現在では,日比孝之教授をリーダーとする科学技術振興機構 (JST)
のプロジェクトにおいて,理論・計算・応用 (統計) の研究者が分野を越えた共同研究を進
めている.分野を越えた共同研究には困難も多いが,さまざまな要因が幸いして日比プロ
ジェクトは大変うまく進んでいると考えている.
以上のような中で,計算代数統計に関してはすでに何回か紹介の機会を与えられている
(青木,竹村 (2007), 竹村 (2006, 2008a, b), 竹村,青木 (2006)).本稿では,いくつかの研究
集会でお話させていただいたことなどを中心に,簡単な例題などを用いて計算代数統計の話
∗
†
東京大学大学院情報理工学系研究科
JST CREST
138
日本統計学会誌 第39巻 第1号 2009
題についてあらためて紹介するとともに,筆者及び共同研究者の最近の研究成果の一部を
紹介する.ただし,4 節の内容については 2008 年の応用統計学会の予稿集 (竹村 (2008a))
の内容と重なりが多いことをお断りしておく.
以下,2 節では,計算代数統計の一つの発端である Pistone-Wynn 流の実験計画につい
て説明する.また 3 節では,壷のモデルという離散確率分布を考える際の最も基本的な考
え方に戻って,分割表のマルコフ基底に関する考え方を説明する.4 節では,多元分割表
解析について筆者が課題と考えている諸問題について論じる.最後に 5 節では,マルコフ
基底や実験計画法に現れる対称性や不変性について,最近の研究成果を含めて説明する.
2.
Pistone-Wynn 流の実験計画
この節では,伝統的な一部実施要因計画の割付けや別名関係などの数学的な構造を,Pistone-
Wynn 流の計算代数統計 (Pistone and Wynn (1996), Pistone et al. (2000)) の観点から眺
めることにより,計算代数統計への動機づけを与える.以下では説明の簡単のために,お
もに各要因の水準が 2 水準である場合について説明する.ただし,多項式環の手法を用い
れば水準数が 2 以外の場合も同様に扱うことができる.
各要因の水準が 2 水準であるような多因子要因実験の一部実施法は,Wu and Hamada
(2000) などの実験計画法の教科書で標準的に解説されている.一方,奥野・芳賀 (1969) の
8 章には以下のような記述があり,田口玄一などのわが国の貢献が強調されている.
多因子実験の計画と解析は,
「直交表」を用いることによって,きわめてエレガ
ントにおこなうことができる.これは,わが国独特の手法であって,田口玄一
氏等に負うものである.諸外国では,いまだに直交表を用いず,面倒な割付け
方をしているために,この有用な手法の普及がたいへん遅れている.
一部実施要因計画の別名関係の扱いには,いかにも代数的な感じがする.しかしながら,
この「代数的な感じ」が,実は多項式環のイデアルの操作に対応することについては,私
自身は Aoki and Takemura (2007) の改訂作業おいてようやく気がついた.それ以前にマ
ルコフ基底の研究の中で,多項式環のイデアルの操作にはかなり慣れていたはずであった
が,Pistone-Wynn 流の実験計画の考え方も同様であることにはなかなか気がつかなかっ
た.ただし,Pistone et al. (2000) の本での説明も,やや形式的に過ぎる部分があり,標
準的な一部実施要因計画との関連がわかりにくいことは事実であると思う.文献としても,
このあたりの明確な記述は Pistone 等の本より後になってであり,1) 2 水準系の議論は
Fontana et al. (2000), 2) より一般の場合は Pistone and Rogantin (2008),で明らかにさ
れて来ている状況と考えられる.
計算代数統計の話題
2.1
139
2 水準系の一部実施計画の基本 (乗法型の記法)
まず,2 水準系の一部実施計画の基本について教科書的な説明を与えよう.ある製品の製
造工程において,製品の品質に影響を与える要因として,温度や圧力などいくつかの要因
が考えられるとする.具体例のために,要因数を 6 とし,それらの要因を A, B, C, D, E, F
とする.それぞれの要因を「低水準」と「高水準」のいずれかに設定して実験をおこなう
こととする.「積型」の記法では,高水準を +1 (あるいは簡単に +),低水準を −1 (ある
いは −) と表すこととする.
水準のすべての組合せを行うとすると,64 = 26 回の実験が必要となる.そこで,実験
回数を 1/4 の 16 回で済ませることを考える.このような実験を 26−2 design という.そ
して,1/4 に減らすための「定義対比」として次の二つを考える:
I = ABE, I = ACDF
(2.1)
例えば,I = ABE の意味は,A, B, C のそれぞれの水準 (±1) をかけ合わせた時に,それ
らの積が +1 となるように水準の組合せが定まっていることを意味する.このルールに従
えば,A = B = +1 の時には E = +1 と「割り付け」る.
いま,それぞれの水準は ±1 であるから,2 乗すると常に +1 である.そこで
A2 = B 2 = C 2 = D2 = E 2 = F 2 = I
(2.2)
という操作のルールを定める.そして,(2.1) の第 1 式の両辺には E をかけ,(2.1) の第 2
式の両辺に F をかけると
E = AB, F = ACD
(2.3)
と書き直すことができる.この第一式のルールは,要因 E の水準を A, B の積として定め
ることを示している.A, B, C, D の水準をまず自由に 24 = 16 通りの組合せでおこない,
E,F の水準をそれぞれ (2.3) 式のように定めてやると,16 回の実験の水準の組合せの設定
は表 1 のようになる.ただし,紙面の節約のために 16 行のうち 6 行のみを示している.
さて (2.2) 式のルールのもとで (2.1) の二つの式を辺々かけあわせると
I = ABE = ACDF = BCDEF
(2.4)
という関係を得る.I を含むようなこのような関係を contrast subgroup と言う.I を含
まない等号関係としては,(2.4) 式に例えば A をかけることによって
A = BE = CDF = ABCDEF
などを得る.このような関係を「別名関係」という.統計的には,これらの 4 個の主効果
および交互作用が一部実施のために完全に「交絡」しており,別々には推定できないこと
を意味している.
140
日本統計学会誌 第39巻 第1号 2009
表1
2.2
26−2 計画の例
A
B
C
D
E
F
+
+
+
+
+
+
+
+
+
−
+
−
+
+
−
+
+
−
+
.
..
+
.
..
−
.
..
−
.
..
+
.
..
+
.
..
−
−
−
+
+
+
−
−
−
−
+
−
加法型への書き換えと線形符号との同値性
ここでは前節の例を加法型に書き換えることにより 2 水準系の一部実施計画と線形符号
の同値性を説明しよう.前節では水準を ±1 とし,水準の組合せの演算を AB などの積の
形で表した.しかしながら数学的には 2 を法とする加法の演算を考えたほうが,議論はあ
る意味では明確となる. それは,2 を法とする加法と乗法により F2 = {0, 1} が「体」 を
なしており, F2 の要素からなるベクトルを通常の線形代数の手法で扱うことができるから
である.いま「高水準」と「低水準」を 0 および 1 で符号化する.つまり
+ → 0,
− → 1
と符号化を変えてやる.そうすると,前節の積の演算が mod 2 での “exclusive or” の加法
の演算と同じであることがわかる.
前節の 26−2 design の例で,6 個の factor の水準を 6 個の「ビット」と考え x1 , . . . , x6
と表す. まず最初の 4 ビットにつては full factorial (完全実施計画) の形に書く.このこと
は,最初の 4 ビットはそのまま「送信する」ことを意味している.5 ビット目と 6 ビット
目は,誤り訂正のために一定のルールで値を定めて付加する.(2.3) 式を加法的に表せば
x5
≡ x1 + x2
x6
≡ x1 + x3 + x4
(mod 2)
(mod 2)
となる. つまり最初の 4 ビットの 1 の数の偶奇を求め, それに応じて 5 ビット目と 6 ビット
目を定めることとなる. 最初の 4 ビットのすべての組み合わせについて実行すれば以下と
141
計算代数統計の話題
なる. ただし紙面の節約のために 16 行のうち 6 行のみを示す.
x1
x2
x3
x4
x5
x6
0
0
0
0
0
0
0
0
0
1
0
1
0
0
1
0
0
1
0
..
.
0
..
.
1
..
.
1
..
.
0
..
.
0
..
.
1
1
1
0
0
0
1
1
1
1
0
1
(2.5)
これが表 1 と全く同じ形であることは明らかである.
すでに述べたように,加法型に書くことのメリットは,一部実施計画を有限体上の通常
の線形代数によって理解できる点にある.2 元体 F2 = {0, 1} の元を要素とする p 次元の
ベクトルについて, 要素ごとに mod 2 で演算をおこなうことによって,{0, 1}p は F2 上の
線形空間となる.この観点からは contrast subgroup I = ABE = ACDF = BCDEF は
{(0, 0, 0, 0, 0, 0), (1, 1, 0, 0, 1, 0), (1, 0, 1, 1, 0, 1), (0, 1, 1, 1, 1, 1)}
の 4 点からからなる 2 次元の線形部分空間 L であり, その基底として I = ABE = ACDF
の 2 本のベクトル
(1, 1, 0, 0, 1, 0), (1, 0, 1, 1, 0, 1)
をとる事ができる. そして (2.5) 式の行からなる 16 点は L の直交補空間である.
2.3
積型記法のメリット
前節のように説明すると,いかにも加法型の記法のほうが数学的に見通しがよい感じを
受ける.それに対して,2.1 節の積型の記法は「単なる説明」のように見える.私自身は長
い間そのような印象を持っていた.しかし実は積型の記法のほうがより代数的なのである.
そもそも Diaconis-Sturmfels 流のマルコフ基底に関する計算代数統計を勉強しはじめた
時に,分割表を単項式 (monomial) に対応させること自体が不思議な感じがした.move を
考える時に,負の要素をなぜ負のべきに対応せずに,monomial の差として表すのか,が
わからなかった.monimial の記法は「積型」である.積型に書いて,はじめて代数の手法
が使えるわけである.Pistone-Wynn 流の実験計画の代数統計でも同じことが起きている
ことに長い間気がつかなかった.
2.1 節の積型記法の代数的な説明は次のように簡単なものである.いま A, B, C, D, E, F
の 6 個の文字を「不定元」と考えて,これらの不定元からなる多項式環 k[A, B, C, D, E, F ]
142
日本統計学会誌 第39巻 第1号 2009
を考える.k は適当な体でよい.k[A, B, C, D, E, F ] の中に,次の 8 個の多項式で生成さ
れるイデアルを考える.
I = hA2 − 1, B 2 − 1, C 2 − 1, D2 − 1, E 2 − 1, F 2 − 1, ABE − 1, ACDF − 1i
Pistone and Wynn の用語では “design ideal” である.16 回の実験は I の零点集合として
与えられる.2.1 節の形式的な操作は,商環 k[A, B, C, D, E, F ]/I の操作と全く同じであ
る.2 個の monomial が別名関係にあるための必要十分条件は,それらの差が design ideal
I に属することである.例えば
BE − ABCDEF ∈ I
である.この観点に立てば,Pistone-Wynn の言うように,例えば別名関係の判定はイデア
ル所属問題であるから,I のグレブナー基底を求めておけば別名関係が判定できることに
なる.いずれにしても,ここで強調すべき点は 2.1 節のような積型の記法での一部実施計
画の説明が便宜的なものではなく,代数的に由緒正しいものであるということである.こ
のことは,積型の記法がなぜ加法型の記法によって駆逐されなかったのか,ということの
理由にもなっていると思われる.
以上述べてきた 2 水準系の場合では,(+, −) ↔ (0, 1) の対応がいかにも単純で,どちら
で考えても同じではないかと思われるかも知れない.しかしながら,例えば 3 水準の実験
を考える場合にはより本質的な差が見えてくるのである (Aoki and Takemura (2007)).
また,積型の記法のメリットとして,non-regular な一部実施計画を統一的に扱うことが
できるという点があげられる.(2.4) 式のような contrast subgroup を用いて水準の組み合
わせを指定する計画を regular fractional factorial design とよぶ.このような形に表され
ない計画を non-regular fractional factorial design とよぶ.現状では,一部実施計画の理論
は regular な場合にかたよっており,non-regular な実験計画の研究は重要な課題である.
例えば Pistone, Riccomagno and Wynn の本の 4.6 節には 2 水準の要因が 5 個の場合
に,“indicator function” f を
1
1
1
1 1
+ x1 x2 x4 − x1 x2 x3 + x1 x2 x4 x5 + x1 x2 x3 x5
2 4 (
4
4
4
)
1 x1 x2 x4 (x5 + 1) + x3 (x5 − 1)
= +
2
4
f (x1 , . . . , x5 ) =
と定義し,16 回の実験の水準の組み合わせを,
I = hx21 − 1, . . . , x25 − 1, f (x1 , . . . , x5 ) − 1i
(2.6)
の零点集合として選ぶ例が示されている.Fontana et al. (2000) によって,任意の一部実
施計画が indicator function f を用いて (2.6) 式の形のイデアルの零点集合として与えられ
計算代数統計の話題
143
ることが示されている.Indicator function の考え方は non-regular design の研究に大変
有用であり,Aoki and Takemura (2009) では indicator function の性質を用いて,どんな
regular fractional factorial design の部分集合ともならないような実験計画の性質を調べて
いる.
壷のモデルから見たマルコフ基底
3.
この節では,壷のモデルという離散確率分布を考える際の最も基本的な考え方がマルコ
フ基底の理解にも有用であることを説明する.2 元分割表についての例題をまじえながら,
グレブナー基底,sorting, 対称群の作用などについて述べる.さらに多元分割表の分解可
能モデルへの拡張も指摘する.
3.1
2 元分割表と北西隅ルール
まず次の簡単な 3 × 3 分割表の例題を考えよう.
例題 1
周辺頻度が以下のように与えられている分割表の中身をうまくうめよ.
表2
解答例:
3 × 3 周辺表の例
*
*
*
6
*
*
*
5
*
*
*
5
7
5
4
16
行優先で右下からうめることを考える.まず右下を min(4, 5) = 4 とする.
*
*
*
6
*
*
*
5
*
*
4
1
7
5
0
12
この段階で,実は 3 列目が (0 0 4)T となることは見えているが,行優先の時にはそこはま
だ確定しないことにする.そこで次に (3,2) 要素を min(1, 5) = 1 でうめると (3,1) 要素も
0 となり
*
*
*
6
*
*
*
5
0
1
4
0
7
4
0
11
となる.さらに (2,3) 要素を min(0, 5) = 0 とし,続いて他の 2 行目をうめると
144
日本統計学会誌 第39巻 第1号 2009
*
*
*
6
1
4
0
0
0
1
4
0
6
0
0
6
6
0
0
0
1
4
0
0
0
1
4
0
0
0
0
0
となり,結果は
となる.
一方最後の列から,列優先でうめる方法を考える.第 3 列が下から上へ
*
*
0
6
*
*
0
5
*
*
4
1
7
5
0
12
*
0
0
6
*
4
0
1
*
1
4
0
7
0
0
7
とうまり,次に第 2 列が下から上へ
と定まり,結局同じ表に到達する.
(解答例終)
以上の例が示唆していることは次のことである.右下の要素からできるだけ大きい値を
入れて行く操作は,グレブナー基底の観点からは revlex 式の項順序 (term order) を考えて
いることにあたる.そして,2 元表においては,列優先の revlex でも行優先の revlex でも,
結果が同じになる.結果表はグレブナー基底による割り算の「余り」(standard monomial)
にあたる.つまり 2 元表においては,二つの異なる term order に基づいて実際に割算を行
うと,常に同じ standard monomial に到達する.また,最適化の観点からは,異なる term
order が同じ最適解を与える例となっている.
最適化された解は,対角付近に頻度が集まっており,順位相関を最大化していると見る
こともできる.このような解は,離散最適化の分野で「北西隅ルール」(Northwest corner
rule) とよばれている.北西隅ルールは列の周辺分布を行の周辺分布に変換する「輸送問
計算代数統計の話題
145
題」の許容解であり,もし輸送コストが “Monge 性” と呼ばれる性質を持つ時は,コスト
を最小化した解となっている事が知られている.これらの点については松井知己氏よりご
教示いただいた.
3.2
添字の sorting による方法
次に添字の sorting の方法を上の例を用いて説明する.Sorting の方法は Sturmfels の
本 (Sturmfels (1996)) の 14 章にあり,さらに大杉・日比により発展されている方法である
(Aoki et al. (2007, 2008) を参照).Sorting の操作は,グレブナー基底の理論で現れるもの
であるが,他の分野ではあまり見かけない操作のように思われる.
同時頻度をうめた次の表をもとに考える.
3
2
1
6
2
1
2
5
2
2
1
5
7
5
4
16
これを単項式に対応させる:
x311 x212 x13 x221 x22 x223 x231 x232 x33
行の添字のみ集めてくると,周辺頻度より
1 が 6 個,2 が 5 個,3 が 5 個
である.列の添字は同様に
1 が 7 個,2 が 5 個,3 が 4 個
である.ここで,列の添字のほうが,グループとして,行の添字より後と考える.例えば,
列の添字に 3 を加えて xij を xi,j+3 と表す.この場合,例えば x11 を x14 と表すことにな
る.そうしたうえで,行の添字と列の添字を区別せずに sort すると
1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3
4 4 4 4 4 4 4 5 5 5 5 5 6 6 6 6
となる.ここで,xij の 1 桁目の i の部分に上の数字を左から順にうめていく:
x1? x1? x1? x1? x1? x1? x2? x2? x2? x2? x2? .x3? x3? x3? x3? x3?
ここで一巡したので,つぎに後半を 2 桁目にうめていく
x14 x14 x14 x14 x14 x14 x24 x25 x25 x25 x25 x35 x36 x36 x36 x36
ここで,4, 5, 6 → 1, 2, 3 と添字を戻すと
x611 x21 x422 x32 x433
となり,sorting を一回施すだけで最適化の解を得る.
146
3.3
日本統計学会誌 第39巻 第1号 2009
2 元表と壷のモデル
前節の sorting は実は壷のモデルで考えるとわかりやすい.例題 1 を次のように書き換
える.
例題 2
いま,壷の中に,1 から 16 まで番号をふった 16 枚のカードがあるとする.各カー
ドには 2 桁の数字を書く欄がある.ここにこれから数字を書いていく.それぞれの欄とも
1,2,3 のいずれかの数字を書く.そして,第 1 桁には
1 を書くカードは 6 枚
2 を書くカードは 5 枚
3 を書くカードは 5 枚
とせよ.また第 2 桁には
1 を書くカードは 7 枚
2 を書くカードは 5 枚
3 を書くカードは 4 枚
とせよ.このような数字のうめ方で,最も規則的で簡単な方法を示せ.
解答例:
第 1 桁には,カードの番号順に,1 を 6 枚に書き,2 を 5 枚に書き,3 を残りの 5
枚に書く.第 2 桁も同様に書く.
Sorting は,同時頻度からまず添字を sort することによって周辺頻度を得て,それから例
題 2 の方法で数字をうめ直していることにあたっている.さらに,グレブナー基底の観点
から重要な事実,すなわち 2 元表の場合には平方自由な 2 次の 2 項式からなるグレブナー
基底が存在すること,に対応して次が成り立つ.
例題 3
以上のような 16 枚への数字のうめ方と異なるうめ方をした場合,必ず 2 枚のカー
ドを選ぶことができ,第 2 桁の数字をとりかえることによって,規則的なうめ方に近づけ
ることができることを示せ.
第 2 桁の数字をとりかえることは,個票データの秘匿措置における swapping に対応す
る (Takemura and Hara (2007)).Swapping は,次数が 2 の move に密接に対応してい
る.それは swapping を分割表の頻度で考えれば,
+1
−1
−1
+1
の形の move となるからであ
る.standard monomial に近づけるように swapping することは,グレブナー基底の要素
での割算に対応している.
計算代数統計の話題
3.4
147
壷への対称群の作用
独立モデルのもとで周辺を与えた I × J の 2 元分割表の条件つき分布は超幾何分布であ
り,確率関数は
∏I
∏J
xi+ ! j=1 x+j !
∏
n! ij xij !
i=1
の形で与えられる.この分布からの直接のサンプリングは,壷のモデルを考えると以下の
ように簡明である.この簡単な事実が対称群 Sn の作用として理解できることは,北海道
大学の吉田知行教授により指摘されている.
いま表 2 のように周辺が所与として,超幾何分布に従って 2 元表を発生させたいとする.
そのために,1 から 16 までの連番と 2 桁の欄 (当初は空白) がある 16 枚のカードを壷に入
れる.そして,壷の中をよく混ぜてから,順番にカードを取り出して,まず第 1 桁目には
6 枚のカードに 1
5 枚のカードに 2
5 枚のカードに 3
と順にうめていく.次に,カードを壷にもどして再度よく混ぜてから第 2 桁目には
7 枚のカードに 1
5 枚のカードに 2
4 枚のカードに 3
と順にうめる.これで分割表がランダムに生成できて,その分布は超幾何分布である.
さて,以上では壷の中を 2 回まぜているが,これは対称群 Sn , n = 16,をそれぞれの桁
に独立に作用させていると理解することができる.すなわち Sn × Sn がカードの集合に作
用している.ただし,2 元表の場合は,実は 1 回目の混合操作は不要なことは明らかであ
る.すなわちこの場合には Sn を 1 回だけ第 2 桁に作用させればよい.
第 2 回目の混合操作を省略して,規則的にうめれば,前節で述べた sorting となり,北
西隅型の standard monomial が得られている.
以上のように,2 元表の超幾何分布の場合には,対称群上の一様分布に対応させることに
より,超幾何分布からの直接の sampling が可能である.しかしながら,一般には MCMC
のほうが適用範囲が広いので
+1
−1
−1
+1
の形の move を用いた MCMC を考察してみる.そ
うすると,吉田知行教授によって指摘されているように,この move を 元の壷に引き戻して
考えれば,実は Sn の生成元である互換をランダムに作用させていることがわかる.この
ように Sn に引き戻して考えると,分割表のファイバー上の MCMC が,Sn の互換によっ
て生成されるランダムウォークに対応していることがわかる.そして,Sn 上のランダム
ウォークの収束速度の評価は,Diaconis の仕事 (Diaconis (1988)) にあるように,対称群
の表現の指標を用いて解析することができる.
148
3.5
日本統計学会誌 第39巻 第1号 2009
分解可能モデルへの一般化
ここまでの 2 元表の議論のほとんどは一般の分解可能モデルに素直に一般化される.
ただし,以下では 2 × 2 × 2 × 2 の一例を示すことにとどめる.いま固定する周辺を
{1, 2}, {2, 3}, {3, 4} とする.
例題 4
壷の中に 1 から 16 まで番号をふった 16 枚のカードがあるとする.各カードには
4 桁の数字を書く欄がある.ここにこれから数字を書いていく.それぞれの欄とも 1,2 の
いずれかの数字を書く.そして
第 (1,2) 桁には
(1,1) の組合せが 6 枚, (1,2) が 3 枚, (2,1) が 2 枚, (2,2) が 5 枚
第 (2,3) 桁には
いずれの組合せも 4 枚づつ
第 (3,4) 桁には
(1,1) の組合せが 3 枚, (1,2) が 5 枚, (2,1) が 3 枚, (2,2) が 5 枚
になるようにせよ.このような数字のうめ方で,最も規則的で簡単な方法を求めよ.
解答例:
(1,2) 桁は単に順にうめて行く.(2,3) 桁は,2 桁目の数字があうカードを順にひ
ろいながら,3 桁目を順にうめて行く.(3,4) 桁は,3 桁目の数字があうカードを順にひろ
いながら,4 桁目を順にうめて行く.
次の例題は実はかなり難しい.
例題 5
以上のような数字のうめ方と異なるうめ方をした場合,必ず 2 枚のカードを選ぶ
ことができて,書いてある数字を入れ換えることによって,必ず以上のうめ方に近づくこ
とができることを示せ.
例題 6
例題 4 と同じ周辺頻度を持つ表を,超幾何分布から直接サンプリングするにはど
うすればよいかを示せ.
解答例:
(1,2) 桁は単に順にうめて行く.(2,3) 桁は,2 桁目の数字によって壷を部分壷に
層別して,部分壷ごとに混ぜる.(3,4) 桁は,3 桁目の数字によって壷を部分壷に層別して,
部分壷ごとに混ぜる.
例題 5 は,分解可能モデルには 2 次の square-free binomial からなるグレブナー基底が
存在することに対応している.例題 6 を MCMC 版に焼直せば,MCMC の収束速度の解析
も可能になると予想される.
149
計算代数統計の話題
多元分割表解析の問題点
4.
この節では,多元分割表の対数線形モデルについて基本的な事項を整理するともに,計
算代数的な観点から多元分割表解析の問題点を指摘する.分割表のモデリングは,元数が
4 元,5 元と増えていくと,モデルの数が急速に増えるために困難になる.この問題の解決
は容易ではないが,ここではいくつかの視点からこの問題を考える.
対数線形モデルはセル確率の対数に線形性を仮定したモデルである.4.1 節以降では対
数線形モデルについて論じるが,その前に対数線形モデル自体の問題点についても簡単に
ふれておく.対数線形モデルは指数型分布族をなし,指数型分布族としての数々の利点を
持っている.しかしながら,対数線形モデルは一般には周辺表をとる操作に関して閉じて
いないという大きな欠点がある.例えば 4 元表に対数線形モデルをあてはめたとして,そ
の 3 元周辺表は必ずしも対数線形モデルには従わない.この場合第 4 変数の水準を固定す
れば,条件つきの 3 元表は対数線形モデルに従うから,3 元表の周辺分布は一般には対数
線形モデルの混合となる.各次元でセルを併合した場合も同様にモデルの混合を考える必
要が生じる.従って,対数線形モデルの混合のモデリングを一般的に扱うことが望ましい
が,現状ではそのような一般論は十分には展開されていないと思われる.このように対数
線形モデルには深刻な欠点もあるが,一般的な扱いやすさから,以下では主に対数線形モ
デルについて論じる.
4.1
多元分割表の記法
ここでは多元分割表の記法を導入する (Lauritzen (1996) および竹村,谷口 (2003) の第
I 部参照).m 元の分割表を考え,変数の集合を ∆ = {1, . . . , m} とする.個々の変数を
δ ∈ ∆ と表す.変数 δ のカテゴリー (水準) の集合を Iδ = {1, . . . , Iδ } と表す.Iδ は第 δ
変数の水準数である.この時,多元分割表のセルの集合 I は Iδ の直積
I=
∏
Iδ
δ∈∆
と表すことができる.個々のセルを i ∈ I と表すこととする.各変数の水準を書き下せば
i = (i1 , . . . , im ) である.変数の集合 ∆ の部分集合を a, b, . . . , などで表す.特定の a-周辺
セルを
ia = (iδ )δ∈a ∈ Ia =
∏
Iδ
δ∈a
と表す.Ia は a-周辺セルの集合である.
各周辺セル ia ∈ Ia に実数を対応させる関数 µ : Ia → R を a を明示して µa と書き,
def
さらに引数を i に拡張して µa (i) = µa (ia ) と書く.このような関数を “a-周辺のみに依
150
日本統計学会誌 第39巻 第1号 2009
存する関数” とよぶ.例えばこの記法では,2 元分割表の独立モデルは
log p(i, j) = µ∅ (i, j) + µ{1} (i, j) + µ{2} (i, j)
と表わされることになる.I 上の実数値関数のなす線形空間の中で,a-周辺のみに依存す
る関数が線形部分空間をなすことに注意する.また b ⊂ a とする時,b-周辺のみに依存す
る関数は a-周辺のみに依存する関数の特殊な場合であることに注意する.すなわち a-周辺
のみに依存する関数の集合は,b-周辺のみに依存する関数の集合をふくむ.
4.2
対数線形モデルの階層モデルと部分モデル
まず対数線形モデルの中で最も広いクラスと考えられる階層モデルを定義する.∆ の部
分集合の族を A とする.例えば 3 変数交互作用のない 3 元分割表のモデル (無 3 因子交互
作用モデル) の場合には,m = 3,A = {{1, 2}, {1, 3}, {2, 3}} とおけばよい.そして A に
対する階層モデルを
log p(i) =
∑
µa (i)
(4.7)
a∈A
で定義する.µa は a に含まれる変数間の交互作用項と理解される.前節最後に述べたこ
とにより,b ⊂ a ∈ A とすると,(4.7) 式の右辺には µb (i) の項が自動的に含まれていると
考えてよい.すなわち A として,
b ⊂ a, a ∈ A ⇒ b ∈ A
(4.8)
の性質を持つとしてもよい.つまり階層モデルにおける「階層的」とは,ある交互作用がモデ
ルに現れる場合には,包含関係の意味でその交互作用より低次の交互作用もモデルに現れるこ
とを意味している.以下では,階層モデルを指定する A は (4.8) 式をみたすものと仮定する.
この約束のもとでは,無 3 因子交互作用モデルは A = {∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}}
で指定されることになる.
さて (4.8) 式の性質を持つ有限集合 ∆ の部分集合族は「抽象的単体的複体」(abstract
simplicial complex) とよばれる (Munkres (1984) p.15).従って,階層モデルの研究は数
学的には抽象的単体的複体の研究と (水準数の考察等を除いて) 同等であることに注意しよ
う.(4.8) 式の性質より,A の中で包含関係の意味で極大なもののみを残して考えてもよ
い.これを Lauritzen (1996) にならって red A と書く.red A の要素間には包含関係がな
い.この性質を持つ集合族は antichain (clutter, Sperner system) などとよばれる.階層
モデルの文脈では,red A を生成集合とよぶことが多い.red A の記法を用いれば,無 3 因
子交互作用モデルは再び red A = {{1, 2}, {1, 3}, {2, 3}} と表される.
ここで,A を単体的複体とし,A には含まれない交互作用項 a ⊂ ∆, a 6∈ A の全体を考
151
計算代数統計の話題
えよう.すなわち ∆ の部分集合全体 2∆ における A の補集合 AC を考える.(4.8) 式は
b ⊃ a, a ∈ AC ⇒ b ∈ AC
とも書けるから,モデルに含まれない交互作用は superset (包含関係の意味でより大きな
集合) をとる操作に関して閉じている.AC を考えることは,モデルに含まれない交互作
用の族を指定することによって階層モデルを指定することにあたる.
ここで階層モデルの数について知られた事項を述べる.{1, . . . , m} の antichain の総数
は Dedekind 数 とよばれ m = 8 までの結果 (Wiedemann (1991)) が以下のように与えら
れている.
m
2
3
4
5
6
7
8
4
18
166
7579
7828352
2414682040996
56130437228687557907786
Dedekind 数は,主効果を含まないモデルも数えた場合の階層モデルの数に対応する.m = 9
の 正確な Dedekind 数は,組合せ爆発のために,ほとんど計算は不可能のように思われる.
m
Korshunov and Shmulevich (2002) によれば,Dedekind 数の漸近的なオーダーは 2(bm/2c)
である.いずれにしても,m = 7 元以上になると,階層モデルの総数はあまりにも大きい.
そこで,階層モデルの部分モデルを考えることが重要となる.4.3 節ではグラフィカルモ
デルを扱う.さらにグラフィカルモデルの重要な部分モデルとして 4.4 節で分解可能モデ
ルを扱う.これらの包含関係は
分解可能モデル ⊂ グラフィカルモデル ⊂ 階層モデル
(4.9)
である.元数 m に対して,これらの部分モデルの総数は以下のようになっている (遠藤
(2004)).
m
2
3
4
5
6
7
8
グラフィカル
2
8
64
1024
32768
2097152
268435456
分解可能
2
8
61
820
18154
617675
30888596
分解可能モデルに限ってもモデルの総数は多い.しかしながら,例えば 2 因子交互作用の
みを含むようなモデル (すなわち A として 2 要素集合までを許すようなモデル) はグラフィ
カルでもないから,グラフィカルモデル以外のモデルを考える必要がないわけではない.
このような観点からは,以上のようなモデル族間の包含関係の中でさらに中間的なモデル
族の特徴づけ,さらには以上の包含関係と異なるようなモデル族間の包含関係の特徴づけ
も興味深い問題である.
152
4.3
日本統計学会誌 第39巻 第1号 2009
グラフィカルモデル
グラフィカルモデルは階層モデルにおいて生成集合 red A があるグラフ G の極大クリー
クの族となっているモデルである.ここでクリークとは,互いに辺 (あるいは枝) によって
結ばれた頂点の集合をいう.統計のグラフィカルモデル関係の文献では,単にクリークと
言うと極大クリークをさすことが多いが,本稿では極大でない場合でもクリークと言う.
次に必ずしもグラフィカルとは限らないモデルについての「独立グラフ」を考え,階層
モデル全体とグラフィカルモデル全体の関係を整理する.I 上の確率分布 {p(i)}i∈I が与
えられた時に {p(i)}i∈I の「独立グラフ」G を次のよう定義する:
δ, δ 0 間に辺が無い ⇔ 「δ, δ 0 以外のすべての変数の値を所与とした時に,
δ, δ 0 が条件つき独立になる」
(4.7) 式から容易にわかるように,一般の階層モデル A が与えられた時,2 つの変数 δ, δ 0 が
他のすべての変数を与えた時に条件つき独立になることと,{δ, δ 0 } 6∈ A となることが同値で
ある.このように,階層モデル A が与えられると,それに対応する独立グラフ G = G(A)
が定まる.G(A) を「A から誘導されるグラフ」とよび,G(A) に対応するグラフィカル
モデルを「階層モデル A から誘導されるグラフィカルモデル」とよぶことにしよう.逆に
見ると,階層モデル A は G(A) からいくつかの大きな交互作用項をゼロと制約したモデ
ルと見ることができる.この観点から,G = G(A) である時,階層モデル A を 「 G から
の制約によって得られるモデル」とよぶことにする.
ところで,A 7→ G(A) は多対 1 写像である.例えば 3 元表の無 3 因子交互作用モデルか
ら誘導されるグラフィカルモデルは飽和モデルである.このことから,階層モデルの集合の
中で,グラフィカルモデルの集合は部分集合としてぽつぽつと存在するのであるが,各グラ
フィカルモデル G には,それを制約した階層モデルの集合が張りついていて,ファイバー
構造をなしていることがわかる.単体的複体の用語を用いれば,各ファイバーは 1-skeleton
を共有する単体的複体の族である.統計的観点からは各ファイバー内でのモデル選択問題
が興味深い.
グラフィカルモデルの特徴づけに関する最も重要な結果は,グラフの分解 (あるいは分
離) の観点から条件つき独立性が完全に記述されるという “Hammersley-Clifford の定理”
(Lauritzen (1996) の 3.2 節,竹村,谷口 (2003) の第 I 部 7.2 節) であると思われる.上で述
べた観点からは,おそらく Hammersley-Clifford の定理は,グラフィカルモデルに対する
ものというよりは,各グラフィカルモデルに付随するファイバーに関するものと思われる.
4.4
分解可能モデル
分解可能モデルは,グラフィカルモデルの部分モデルであり,グラフ G がコーダルグラ
フである場合に対応する.ここで G がコーダルグラフであるとは,長さ 4 以上の閉路には
153
計算代数統計の話題
途中の頂点間を結ぶ「弦」が必ず存在することを言う.コーダルグラフは性質の良いグラ
フであり,統計のみならずさまざまの分野に現れる.これらの事柄は最近ではよく知られ
ていることであるが,ここでは階層モデルの分解という観点から分解可能モデルを考える
こととする.階層モデルの分解に関しては Malvestuto and Moscarini (2000) 及び Leimer
(1993) が基本的な文献であるが,原 (2007) による解説がわかりやすい.以下の記述も原
(2007) に負う部分が多い.また Hara and Takemura (2008) でも,グラフに限定している
が,必要な事項が整理されている.
分解可能モデルは最近ではグラフィカルモデルの部分モデルととらえることが多いが,
歴史的には分解可能モデルの概念のほうが先に定義されている (宮川 (1997) の 5.1.d 節).
例えば Haberman (1974) の 5 章では,分解可能モデルを次の形で定義している.
定義 4.1 (Haberman の Def.5.4) 階層モデル A が分解可能であるとは,red A が
一つの集合からなるか,あるいは二つの分解可能モデル A1 , A2 が存在して,red A =
red A1 ∪ red A2 , red A1 ∩ red A2 = ∅,と分割され,かつ a ∈ red A1 , b ∈ red A2 が存在
して,
[ ∪
a0
]
a0 ∈A1
∩
[ ∪
]
b0 = a ∩ b
b0 ∈A2
となることである.
コーダルグラフの構造は,極大クリークの集合 C と,“minimal vertex separator” の集合
S によって完全に指定される.ただし S の各要素には重複度 (正整数) が付随しているた
め,ここでは S を “multiset” とし,各要素が重複度の回数だけ含まれるものと定義する.
統計的推測の観点からは,分解可能モデルは様々な良い性質を持っている.特に最尤推
定量が
 ∏
x(ic )
1


 ∏ c∈C
, if x(ic ) > 0, ∀c ∈ C,
p̂M L (i) = n s∈S x(is )


0,
otherwise,
(4.10)
と明示的に表される.また Sundberg (1975) より,十分統計量を与えた時の分割表の条件
つき分布が
∏
p({x(i)}i∈I | {x(ia )}ia ∈Ia ,
a∈A )
=
n!
∏
c∈C x(ic )!
∏
x(i)!
× s∈S x(is )!
i∈I
(4.11)
と明示的に表される.なお,分解可能モデル以外の階層モデルについても,最尤推定値は
母数空間の境界を含めて一意に存在し,比例反復法によって数値的に求めることができる
(Lauritzen (1996) の Theorem 4.11 及び Theorem 4.13).
以上のように分解可能モデルでは,定義 4.1 の分解が再帰的に最後まで進み,最終的に
はクリークまで分解される.このことによって,(4.10) 式や (4.11) 式のような明示的な結
154
日本統計学会誌 第39巻 第1号 2009
果が成り立つのであるが,定義 4.1 の分解は,分解が途中までしか進まない場合であって
も統計的推測には本質的な意味を持っているのである.今,定義 4.1 の分解の部分だけを
取り出して次の定義を与える.
定義 4.2
階層モデル A が s ∈ A により二つの (空でない) 階層モデル A1 , A2 に分離
されるとは,
1) red A = red A1 ∪ red A2 , red A1 ∩ red A2 = ∅,かつ a ∈ red A1 , b ∈ red A2 が存在
して,
[ ∪
a0
]
∩
[ ∪
a0 ∈A1
]
b0 = a ∩ b = s,
b0 ∈A2
を満たす,あるいは
2) red A = red A1 ∪ red A2 , red A1 ∩ red A2 = {s},red A1 ) {s}, red A2 ) {s}, かつ
[ ∪
a0 ∈A1
a0
]
∩
[ ∪
]
b0 = s
b0 ∈A2
を満たすことである.
定義 4.2 を満たす s を Malvestuto and Moscarini (2000) に従って A の “divider” と呼
ぶことにする.もし A 自体が分解可能モデルである場合には,divider の定義は minimal
vertex separator の定義と同等である.また divider を持たない A を “compact” とよぶ.
定義 4.2 の 2) にあるように,s ∈ red A であることもあり得る.例えば二つの無 3 因子
交互作用モデルを一つの 2 変数交互作用項 {2, 3} によってはりあわせたモデル
red A = {{1, 2}, {1, 3}, {2, 3}, {3, 4}, {2, 4}}
においては,s = {2, 3} は divider であり,red A1 = {{1, 2}, {1, 3}, {2, 3}}, red A2 =
{{3, 4}, {2, 4}, {2, 3}} とおけばよい.この A から {2, 3} の交互作用を削除すると 4 cycle
model
red A = {{1, 2}, {1, 3}, {3, 4}, {2, 4}}
が得られる.4 cycle model には divider は存在しない.すなわち 4 cycle model は compact
である.
統計的には,s が divider であれば,s に属する変数を固定した時に (s 以外の) A1 に属
する変数と A2 に属する変数は条件つき独立になるが,divider としては s が A に属する
計算代数統計の話題
155
ことを要求していることに注意しよう.上の二つのモデルのいずれでも {2, 3} を与えた時
に 1 と 4 は条件つき独立であるが,4 cycle model においては {2, 3} は divider ではない.
Divider の基本的な重要性は次の点にある.定義 4.2 を再帰的に適用して A を分解し
ていくと,適用の順序にかかわらず分解は一意に定まり,分解の結果は A の極大な部分
compact の族となる.この分解の操作を “compaction” とよぶ.極大部分 compact 間の関
係は,コーダルグラフにおける極大クリーク間の関係と全く同様であり,極大部分 compact
の perfect sequence や,極大部分 compact 間を結ぶ junction tree などが,コーダルグラ
フの場合と全く同様に定義される.
統計的推測の観点からすると,階層モデルが divider を持ち極大部分 compact に分解さ
れる場合には,極大部分 compact ごとに推定や検定の手続きを分解することができる.最
尤推定においては各極大部分 compact ごとの最尤推定を (4.10) 式に対応する形で組み合わ
せることによって,モデル全体の最尤推定値が得られる.モデルの適合度検定においても,
尤度比が compaction に対応する形で分解される.また正確検定をおこなうためのマルコ
フ基底やグレブナー基底に関しても,Hoşten and Sullivant (2002) や Dobra and Sullivant
(2004) によって示されたように,各極大部分 compact ごとのマルコフ基底やグレブナー
基底を組合せて,モデル全体のマルコフ基底やグレブナー基底を構成することができる.
以上のように,compaction は階層モデルの推測に基本的な重要性を持つが,compaction
によるモデルの分類は,(4.9) 式のモデルの包含関係の細分とはなっていないように思われ
る.多元分割表のモデリングの戦略としては,まず divider の集合を確定し,その上で極大
部分 compact ごとに (4.9) 式の包含関係にそってモデル選択をおこなうことも考えられる.
5.
配置の対称性
本稿の最後の話題として,
「配置」の対称性の話題をとりあげる.ここで配置とは,狭い
意味ではマルコフ基底を定義する行列の列ベクトルの集合を指すが,この節ではラテン方
格や数独などの組み合わせデザインも念頭においている.
冒頭でもふれたように計算代数統計の発端としては Diaconis-Sturmfels 流のマルコフ基
底の理論と Pistone-Wynn 流の実験計画の理論の二つがあげられる.両者の接点は現状で
はあまり大きくはないが,Aoki and Takemura (2006, 2007) における離散観測値の実験計
画へのマルコフ基底の応用や,組み合わせデザインへの計算代数の応用 (例えば Fontana
and Rogantin (2009), Hara and Takemura (2009)) が両者の接点としてあげられる.以下
では不変性の観点からマルコフ基底及びデザインの問題を考える.
簡単な例として,2 × 3 分割表の独立モデルを考えよう.このモデルの十分統計量は行和
156
日本統計学会誌 第39巻 第1号 2009
および列和であり,要素を辞書式に並べて同時頻度と十分統計量の関係を行列で表すと
 
 x11
 


1 1 1 0 0 0 
x


 1+  

x
12
 
 

x2+  0 0 0 1 1 1  
 x 
 

13 

 


=
x+1  1 0 0 1 0 0 

 x 
 


21

 


x+2  0 1 0 0 1 0 

 x22 
 


0 0 1 0 0 1  
x+3
x23
の形となる.これを t = Ax と表す.A (あるいは A の各列) を配置 (configuration) と
よぶ.
マルコフ基底の理論において,move とは周辺頻度を変化させない整数ベクトルであり,
ker A に属する整数ベクトルである.例えば
+1
−1
−1
+1
の要素を辞書式に並べたベクトル z
は 0 = Az を満たすことが見てとれる.実はマルコフ基底は ker A のみに依存する.また,
2 元分割表の独立モデルを対数をとって表すと log pij = αi + βj と書けるが,i, j を動か
して行列の形に書くと,独立モデルは
(log p11 , . . . , log p23 ) = (α1 , α2 , β1 , β2 , β3 )A
と書ける.従ってモデルは A の行のはる空間 (行空間) に対応している.そして行空間の
基底のとり方がモデルの parametrization に対応する.
ところで,2 × 3 の分割表の独立モデルは,行の並べ替えおよび列の並べ替えについて不
変である.この不変性をモデル log pij = αi + βj について考えれば,添字 i, j のそれぞれ
の並べ替えによってモデルが変わらないことを表している.また move で考えれば
+1
−1
−1
+1
の形の move は列および行を並べ替えてもやはり move である.さて,以上の 2 × 3 の例で
は行数と列数が異なるので,対称性としては行及び列の並べ替えを考えればよいが, 3 × 3
のように行数と列数が等しい場合には,対称性として軸の入れ替えも考慮しなければなら
ない.
一般に配置 A が与えられた時に A の持つ対称性をどのように定義したらよいだろうか.
ここで対称性というときに,
「最大の対称性」を考えることが数学的には自然に思われる.
例えば正多角形は回転に対して対して対称であるが,鏡映に対しても対称であり,正多角
形の対称性は回転および鏡映によって生成される 2 面体群 (dihedral group) によって特徴
づけられる.このような動機づけから Aoki and Takemura (2008) においては,所与の A
の「最大不変群」を ker A を不変に保つような A の列の並べかえのなす群として定義した.
A の行空間 (すならちモデル) と ker A が互いに直交補空間の関係にあることから,A の最
大不変群はモデルを不変に保つ A の列の並べかえのなす群として定義してもよい.
157
計算代数統計の話題
以上のような最大不変群の定義は,階層モデルの最大不変群に関する研究 (Sei et al.
(2009)) の動機付けとなった.ここではラテン方格および数独を例にとって,それらと階層
モデルとの関連を不変性の観点から説明しよう.
まず次の簡単な 3 × 3 のラテン方格を考える.
1 2
3
2 3
1
3 1
2
ラテン方格に書かれている数字を「階数」を表す数字とみて,3 階建ての 0-1 表示にすれば
1
0
0
0
1
0
0
0
1
0
0
1
1
0
0
0
1
0
0
1
0
0
0
1
1
0
0
1階
2階
3階
となる.以上のような表示はラテン方格の orthogonal array representation とよばれるこ
ともある (Hara and Takemura (2009)).3 階建ての表示は 3 × 3 × 3 の分割表の形をしてお
り,どの 2 元周辺頻度もちょうど 1 である.ところで,2 元周辺頻度が十分統計量となる分
割表のモデルは無 3 因子交互作用モデル red A = {{1, 2}, {1, 3}, {2, 3}} である.このこと
から,ラテン方格は無 3 因子交互作用モデルにおいて,十分統計量がすべて 1 に固定された
分割表に対応することがわかる.Aoki and Takemura (2008) の定理 2 によれば,I × I × I
の無 3 因子交互作用モデルの最大不変群は各変数の水準の並べ替えおよび 3 軸の入れ替え
からなる.ラテン方格の文脈では,各変数の水準の並べ替えのみを考慮した群作用の orbit
を isotopy class, 3 軸の入れ替えまで考慮した群作用の orbit を main class と呼んでいる
(Colbourn and Dinitz (2007) の第 3 部).
次に,対称性の構造がより複雑な数独の例を用いて Sei et al. (2009) の結果の一部を述
べる.数独は,よく知られているように,9 × 9 のマス目に 1 ∼ 9 の数字をうめて行くパ
ズルである.9 × 9 のマス目はさらに 3 × 3 のブロックに分けられている.
k
l
i
j
c
158
日本統計学会誌 第39巻 第1号 2009
以上の表示において i をバンド,j を行, k をスタック, l を列,c をカラー,とよぶことに
する.ラテン方格と同様に,カラーを階数に対応させた 9 階建ての 0-1 表で考えると,数
独は
red A = {{1, 2, 5}, {3, 4, 5}, {1, 3, 5}, {1, 2, 3, 4}}.
で定義される階層モデルに対応することがわかる.このモデルの最大不変群は,各バンド
i ごとに j = 1, 2, 3 の異なる並べ替え (S3 の異なる元) や,各スタック k ごとに l = 1, 2, 3
の異なる並べ替えを含むことが示される.このように,数独の対称性においては,群の作
用が入れ子の形で現れる.このような群作用を環積 (wreath product) と読んでいる.Sei
et al. (2009) では,ゆるい正則条件のもとで,階層モデルの最大不変群が,単体的複体に
付随するある半順序集合に関する一般化された環積の形に表されることを示している.
謝辞
本稿に関して青木敏氏,栗木哲氏,清智也氏,原尚幸氏より貴重なコメントをいただきま
した.
参 考 文 献
Aoki, S. and Takemura, A. (2006). Markov chain Monte Carlo tests for designed experiments. arXiv:math/
0611463v1. Submitted for publication.
青木 敏,竹村彰通 (2007). 「統計学とグレブナー基底 — 計算代数統計の発端と展開」『数学』59(3), 283–302.
Aoki, S. and Takemura, A. (2007). Markov basis for design of experiments with three-level factors. arXiv:
0709.4323v2. To appear in Algebraic and Geometric Methods in Statistics dedicated to Professor Giovanni
Pistone, Cambridge University Press (P. Gibilisco, E. Riccomagno, M.P. Rogantin and H.P. Wynn, eds.)
Aoki, S. and Takemura, A. (2008). The largest group of invariance for Markov bases and toric ideals, J. Symbolic
Computation, 43, 342–358.
Aoki, S. and Takemura, A. (2009). Some characterizations of affinely full-dimensional factorial designs, J.
Statist. Plann. Infer., doi:10.1016/j.jspi.2009.04.002.
Aoki, S., Hibi, T., Ohsugi, H. and Takemura, A. (2007). Markov basis and Groebner basis of Segre-Veronese
configuration for testing independence in group-wise selections. arXiv:0704.1074v2. To appear in Ann.
Inst. Statist. Math.
Aoki, S., Hibi, T., Ohsugi, H. and Takemura, A. (2008). Gröbner bases of nested configurations, J. Algebra,
320, 2583–2593.
Colbourn, C. J. and Dinitz, J. H. (2007). Handbook of Cmbinatorial Designs, 2nd ed., Chapman & Hall/CRC,
Boca Raton.
Diaconis, P. (1988). Group Representations in Probability and Statistics, Lecutre Notes-Monograph Series,
Vol. 11, Institute of Mathematical Statistics, Hayward, California.
Diaconis, P. and Sturmfels, B. (1998). Algebraic algorithms for sampling from conditional distributions, Ann.
Statist., 26, 363–397.
Dobra, A. and Sullivant, S. (2004). A divide-and-conquer algorithm for generating Markov bases of multi-way
tables, Comput. Statist., 19, 347–366.
遠藤祐司 (2004). 分解可能モデルの列挙アルゴリズム.東京大学工学部計数工学科卒業論文.2004 年 2 月.
Fontana, R., Pistone, G. and Rogantin, M.-P. (2000). Classification of two-level factorial fractions, J. Statist.
Plann. Infer., 87, 149–172.
計算代数統計の話題
159
Fontana, R. and Rogantin, M.-P. (2009). Indicator function and sudoku designs. To appear in Algebraic and
Geometric Methods in Statistics dedicated to Professor Giovanni Pistone, Cambridge University Press (P.
Gibilisco, E. Riccomagno, M. P. Rogantin and H. P. Wynn, eds.)
Haberman, S. J. (1974). The Analysis of Frequency Data, The university of Chicago press.
原尚幸 (2007). 階層モデルにおける比例反復法 — 単体的複体の分離と三角化の観点から—.科学研究費「計算
代数統計学の展開」研究会資料.2007 年 6 月.
Hara, H. and Takemura, A. (2008). A localization approach to improve iterative proportional scaling in Gaussian
graphical models, arXiv:0802.2581v1. To appear in Comm. Statist. Theory Meth..
Hara, H. and Takemura, A. (2009). Connecting tables with zero-one entries by a subset of a Markov basis,
arXiv:0908.4461v1.
Hoşten, S. and Sullivant, S. (2002). Gröbner bases and polyhedral geometry of reducible and cyclic models, J.
Combin. Theory Ser. A, 100, 277–301.
Korshunov, A. D. and Shmulevich, I. (2002). On the distribution of the number of monotone Boolean functions
relative to the number of lower units, Discrete Math., 257, 463–479.
Lauritzen, S. L. (1996). Graphical Models Oxford University Press, Oxford.
Leimer, H. G. (1993). Optimal decomposition by clique separators. Discrete Math., 113, 99–123.
Malvestuto, F. M. and Moscarini, M. (2000). Decomposition of a hypergraph by partial-edge separators, Theoret.
Comput. Sci., 237, 57–79.
宮川雅巳 (1997). グラフィカルモデリング. 朝倉書店.
Munkres, J. R. (1984). Elements of Algebraic Topology, Addison-Wesley.
奥野忠一,芳賀敏郎 (1969). 実験計画法. 培風館.
Pistone, G. and Wynn, H. P. (1996). Generalised confounding with Gröbner bases, Biometrika, 83, 653–666.
Pistone, G., Riccomagno, E. and Wynn, H. P. (2000). Algebraic Statistics, Computational Commutative Algebra
in Statistics, Chapman & Hall.
Pistone, G. and Rogantin, M.-P. (2008). Indicator function and complex coding for mixed fractional factorial
designs, J. Statist. Plann. Infer., 138(3), 787–802.
Sei, T., Aoki, S. and Takemura, A. (2009). Perturbation method for determining the group of invariance of
hierarchical models, Adv. Appl. Math., doi:10.1016/j.aam.2009.02.005.
Sturmfels, B. (1996). Gröbner Bases and Convex Polytopes, American Mathematical Society, Providence, RI.
Sundberg, R. (1975). Some results about decomposable (or Markov-type) models for multidimensional contingency tables: Distribution of marginals and partitioning of tests. Scand. J. Statist., 2, 71–79.
竹村彰通 (2006). 統計数学における計算代数的方法.日本数学会 2006 年度秋期総合分科会総合講演.
竹村彰通 (2008a).分割表のグラフィカルモデルとその周辺.応用統計学会特別講演.筑波大学.2008 年 6 月.
竹村彰通 (2008b).計算代数統計の話題.日本統計学会賞受賞講演.慶応義塾大学.2008 年 9 月.
竹村彰通,谷口正信. (2003). 統計学の基礎 I.統計科学のフロンティア 1,岩波書店.
竹村彰通,青木敏 (2006).統計学におけるグレブナー基底.グレブナー基底の現在,日比孝之 [編],数学書房,
第 3 章所収.
Takemura, A. and Hara, H. (2007). Conditions for swappability of records in a microdata set when some
marginals are fixed, Comp. Statist., 22, 173–185.
Wiedemann, D. H. (1991). A computation of the eighth Dedekind number, Order , 8, 5–6.
Wu, C. F. J. and Hamada, M. (2000). Experiments: Planning, Analysis, and Parameter Design Optimization,
Wiley, New York.