計算理論 - 北海道大学

代入と準同型写像
凖同型の 特徴づ け
おわり
計算理論
Thomas Zeugmann
北海道大学 大学院情報科学研究科
アルゴ リズ ム研究室
http://www-alg.ist.hokudai.ac.jp/∼thomas/ToC/
第 8 回: CF と準同型写像
(日本語訳: 湊 真一, 大久保 好章)
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 I
こ の 講義では引き 続き ,文脈自由言語の 有用な性質と特徴づ け に
ついて述べる.まず 代入演算から見ていこ う .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 I
こ の 講義では引き 続き ,文脈自由言語の 有用な性質と特徴づ け に
ついて述べる.まず 代入演算から見ていこ う .
定義 1
Σ と ∆ を任意の 2 つの 有限アルファベットとする.
写像 τ : Σ −→ ℘(∆∗ ) の こ とを代入 (substitution) と呼ぶ.我々は
τ を写像 τ : Σ∗ −→ ℘(∆∗ ) (つまり文字列) に 拡張する.た だし 次
の よう に 定義する.
(1) τ(λ) = λ,
(2) すべての w ∈ Σ∗ と x ∈ Σ に 対し て τ(wx) = τ(w)τ(x).
写像 τ は 次の よう に し て言語 L ⊆ Σ∗ に 一般化される.
[
τ(L) =
τ(w)
w∈L
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 II
つまり,代入演算は, Σ の 各記号を ∆ 上の 言語に 置き 換え る.1
つの 記号に 対応する言語は,有限集合でも無限集合でもよい.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 II
つまり,代入演算は, Σ の 各記号を ∆ 上の 言語に 置き 換え る.1
つの 記号に 対応する言語は,有限集合でも無限集合でもよい.
例. 1
Σ = {0, 1}, ∆ = {a, b} とすると, τ(λ) = λ, τ(0) = {a} および
τ(1) = {b}∗ に より定義される写像 τ は代入である.
τ(010) を計算し てみよう .定義より
τ(010) = τ(01)τ(0) = τ(0)τ(1)τ(0) = {a}{b} ∗ {a} = ahbia ,
た だし ,最後の 等式は正規表現の 定義に よる.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 III
次に ,代入演算に 関する言語族 L の 閉包が何を意味するかを定義
し よう .こ こ で特別な考慮が必要である.最初に ちょっ と考え る
と,可能なすべての 代入演算 τ に ついて,条件 τ(L) ∈ L を満たす
必要があるよう に 思われる.
し かし ,こ の 要求は強すぎる. なぜか ?
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 III
次に ,代入演算に 関する言語族 L の 閉包が何を意味するかを定義
し よう .こ こ で特別な考慮が必要である.最初に ちょっ と考え る
と,可能なすべての 代入演算 τ に ついて,条件 τ(L) ∈ L を満たす
必要があるよう に 思われる.
し かし ,こ の 要求は強すぎる. なぜか ?
Σ = {0, 1}, ∆ = {a, b} かつ L = REG とし よう .さらに , τ(0) = L
と仮定する.た だし L は ∆ 上の 任意の 言語であっ て,再帰的に 列
挙可能だが非再帰的な言語であるとする.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 III
次に ,代入演算に 関する言語族 L の 閉包が何を意味するかを定義
し よう .こ こ で特別な考慮が必要である.最初に ちょっ と考え る
と,可能なすべての 代入演算 τ に ついて,条件 τ(L) ∈ L を満たす
必要があるよう に 思われる.
し かし ,こ の 要求は強すぎる. なぜか ?
Σ = {0, 1}, ∆ = {a, b} かつ L = REG とし よう .さらに , τ(0) = L
と仮定する.た だし L は ∆ 上の 任意の 言語であっ て,再帰的に 列
挙可能だが非再帰的な言語であるとする.
すると明らかに τ({0}) = L もまた 成り立つ.し た がっ て
τ({0}) < REG である.一方, {0} ∈ REG であるから, REG は代入
演算に 関し て閉じていないこ とに なる.同様に し て CF も代入に
関し て閉じていないこ とが示される.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 IV
こ こ で考え ないといけ ない点は,許される代入演算の 集合を, Σ
の 要素から L に 属する言語への 写像だけ に 制限し なけ ればいけ な
いという こ とである.し た がっ て,以下の 定義に た ど り着く .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入 IV
こ こ で考え ないといけ ない点は,許される代入演算の 集合を, Σ
の 要素から L に 属する言語への 写像だけ に 制限し なけ ればいけ な
いという こ とである.し た がっ て,以下の 定義に た ど り着く .
定義 2
Σ を任意の アルファベットとし ,L を Σ 上の 任意の 言語族とする.
もし もすべての 写像 τ : Σ −→ L とすべての L ∈ L に 対し て,
τ(L) ∈ L が成り立つならば, L は代入に 関して閉じ てい る
(closed under substitutions) と言う .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
凖同型写像 I
定義 3
Σ と ∆ を任意の 2 つの 有限アルファベットとする.写像
ϕ : Σ∗ −→ ∆∗ は,
すべての v, w ∈ Σ∗ に 対し てϕ(vw) = ϕ(v)ϕ(w) .
ならば準同型写像 (homomorphism) であると言う .さらに ,
すべての w ∈ Σ∗ に 対し てϕ(w) = λ ならば w = λ .
ならば, ϕ は λ-自由 (λ-free) 凖同型写像であるという .そ し て,
ϕ : Σ∗ −→ ∆∗ が凖同型写像ならば, ϕ の逆写像 (inverse)
ϕ−1 : ∆∗ −→ ℘(Σ∗ ) を定義でき る.ただし 各々の s ∈ ∆∗ に ついて
ϕ−1 (s) = {w | w ∈ Σ∗ かつ ϕ(w) = s} .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
凖同型写像 II
し た がっ て,凖同型写像は代入の 特殊なケースで ある.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
凖同型写像 II
し た がっ て,凖同型写像は代入の 特殊なケースで ある.
すなわち,凖同型写像は, Σ の 各記号を単一要素 (Singleton) の 集
合に 対応づ け る.凖同型写像の 定義より明らかに , Σ の 各記号に
対する写像 ϕ を決めておけ ば十分である.なお,凖同型写像を扱
う 場合,1個の 文字列だけ を含む言語を表すた めに , そ の 文字列
そ の もの を記述するこ とが一般的で ある.
(すなわち, {s} と書く
代わりに ,単に s と書く .
)
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
凖同型写像 II
し た がっ て,凖同型写像は代入の 特殊なケースで ある.
すなわち,凖同型写像は, Σ の 各記号を単一要素 (Singleton) の 集
合に 対応づ け る.凖同型写像の 定義より明らかに , Σ の 各記号に
対する写像 ϕ を決めておけ ば十分である.なお,凖同型写像を扱
う 場合,1個の 文字列だけ を含む言語を表すた めに , そ の 文字列
そ の もの を記述するこ とが一般的で ある.
(すなわち, {s} と書く
代わりに ,単に s と書く .
)
例. 2
Σ = {0, 1}, ∆ = {a, b} とする.ϕ(0) = ab および ϕ(1) = λ と定
義された 写像 ϕ : Σ∗ −→ ∆∗ は準同型であるが λ-自由な準同型で
はない.
ϕ に 1100 を与え ると,
ϕ(1100) = ϕ(1)ϕ(1)ϕ(0)ϕ(0) = λλabab = abab が生成され,
言語 1h0i1 に 対し ては ϕ(1h0i1) = habi となる.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
注意 点
今導入された 概念の 重要性を知るた めに ,言語
L = {an bn | n ∈ N} を考え てみよう .こ の 言語は文脈自由である
から,直感的に は {0n 1n | n ∈ N} もまた 文脈自由である.なぜな
らば,我々は文法をた ど りながら,出現するすべての a を 0 に ,
b を 1 に 置き 換え れば良いからである.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
注意 点
今導入された 概念の 重要性を知るた めに ,言語
L = {an bn | n ∈ N} を考え てみよう .こ の 言語は文脈自由である
から,直感的に は {0n 1n | n ∈ N} もまた 文脈自由である.なぜな
らば,我々は文法をた ど りながら,出現するすべての a を 0 に ,
b を 1 に 置き 換え れば良いからである.
こ の 観察から,もし も出現するすべての a と b を,文字列 v と w
に そ れぞれ置き 換え た とき に , やはり文脈自由言語が得られるよ
う に 思え る.し かし ,もし も出現するすべての a と b を,文脈自
由な文字列集合 V と W に そ れぞれ置き 換え た とすると,そ れが
文脈自由言語に なるかど う かは,直感的に は,さほど 明らかでは
ない.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
注意 点
今導入された 概念の 重要性を知るた めに ,言語
L = {an bn | n ∈ N} を考え てみよう .こ の 言語は文脈自由である
から,直感的に は {0n 1n | n ∈ N} もまた 文脈自由である.なぜな
らば,我々は文法をた ど りながら,出現するすべての a を 0 に ,
b を 1 に 置き 換え れば良いからである.
こ の 観察から,もし も出現するすべての a と b を,文字列 v と w
に そ れぞれ置き 換え た とき に , やはり文脈自由言語が得られるよ
う に 思え る.し かし ,もし も出現するすべての a と b を,文脈自
由な文字列集合 V と W に そ れぞれ置き 換え た とすると,そ れが
文脈自由言語に なるかど う かは,直感的に は,さほど 明らかでは
ない.
し かし ながら, 我々はこ の 閉包性を証明するこ とを目指す. 以下
では,代入の 定義と同じよう に ,常に 2 つの 有限アルファベット
Σ と ∆ を仮定する.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 I
定理 1
CF は代入演算に 関し て閉じている.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 I
定理 1
CF は代入演算に 関し て閉じている.
(証明) ある1つの 言語 L ∈ CF と ある代入 τ を考え る.た だし す
べての a ∈ Σ に 対し て τ(a) は文脈自由言語であるとする.我々は
τ(L) が文脈自由であるこ とを示さなけ ればならない. そ の た めに ,
L(G) = τ(L) となるよう な文脈自由文法 G = [T , N, σ, P] を作ろう .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 I
定理 1
CF は代入演算に 関し て閉じている.
(証明) ある1つの 言語 L ∈ CF と ある代入 τ を考え る.た だし す
べての a ∈ Σ に 対し て τ(a) は文脈自由言語であるとする.我々は
τ(L) が文脈自由であるこ とを示さなけ ればならない. そ の た めに ,
L(G) = τ(L) となるよう な文脈自由文法 G = [T , N, σ, P] を作ろう .
L ∈ CF であるから,L = L(G) となるよう なチョムスキー標準形の
文脈自由文法 G = [Σ, N, σ, P] が存在する.次に ,Σ = {a1 , . . . , an }
とし て,すべての a ∈ Σ に 対し て, τ(a) を考え る.仮定より,す
べての a ∈ Σ に 対し て τ(a) ∈ CF である.よっ て,すべての
a ∈ Σ に 対し て τ(a) = L(Ga ) となるよう な文脈自由文法
Ga = [Ta , Na , σa , Pa ] が存在する.こ こ で,集合 N, Na1 , . . . , Nan
が,互いに 素であると仮定し ても一般性は失われない.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 II
こ こ で,先に 進む た め のアイデ アが必要である.そ れを得るた め,
G に おけ る可能な導出を調べてみよう .次の 導出
∗
σ =⇒ x1 x2 · · · xm ,
G
をすべての xi ∈ Σ (i = 1, . . . , m) に ついて考え よう .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 II
こ こ で,先に 進む た め のアイデ アが必要である.そ れを得るた め,
G に おけ る可能な導出を調べてみよう .次の 導出
∗
σ =⇒ x1 x2 · · · xm ,
G
をすべての xi ∈ Σ (i = 1, . . . , m) に ついて考え よう .すると, G
はチョムスキー標準形であるから, 生成規則(hxi → xi ) ∈ P,
i = 1, . . . , m, が必ず 存在し ,そ れに よっ て以下の 導出
∗
m
G
G
σ =⇒ hx1 hx2 · · · hxm =⇒ x1 x2 · · · xm ,
(1)
が,すべての hxi ∈ N に ついて行われるはず である.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 III
像 (写像の 行き 先)τ(x1 · · · xm ) が
τ(x1 )τ(x2 ) · · · τ(xm )
に よっ て計算でき るこ とを考慮すると, こ の 像に 含まれる各文字
列 w1 w2 · · · wm に 対し て,次の 導出
∗
σxi =⇒ wi
i = 1, . . . , m .
G xi
が存在し なけ ればならない.こ の こ とから直ちに G を構築するア
イデアが生まれる.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 IV
hx1 hx2 · · · hxm が得られた とき に ,式 (1) の 導出 を中断するこ と
を考え よう .x1 x2 · · · xm を導出する代わりに 必要なこ とは,
σx1 · · · σxm を生成するこ とであり,すなわち, i = 1, . . . , m に つ
いて,生成規則 (hxi → xi ) ∈ P を (hxi → σxi ) ∈ P で置き 換え
る必要がある. し た がっ て,以下を定義する.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 IV
hx1 hx2 · · · hxm が得られた とき に ,式 (1) の 導出 を中断するこ と
を考え よう .x1 x2 · · · xm を導出する代わりに 必要なこ とは,
σx1 · · · σxm を生成するこ とであり,すなわち, i = 1, . . . , m に つ
いて,生成規則 (hxi → xi ) ∈ P を (hxi → σxi ) ∈ P で置き 換え
る必要がある. し た がっ て,以下を定義する.
[
T =
Ta
a∈Σ
N = N∪
[
Na
a∈Σ
σ = σ
P =
[
a∈Σ
Pa
!
!
∪ P[a//σa ] .
こ れを用いて G = [T , N, σ, P] とする.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 V
τ(L) = L(G) を示す作業が残っ ている.
主張 1. τ(L) ⊆ L(G).
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 V
τ(L) = L(G) を示す作業が残っ ている.
主張 1. τ(L) ⊆ L(G).
∗
もし , xi ∈ Σ に ついて σ =⇒ x1 · · · xm であり, wi ∈ Tx∗i に
G
∗
ついて σxi =⇒ wi ならば( i = 1 . . . , m), x1 · · · xm は
G xi
∗
∗
G
G
σ =⇒ hx1 · · · hxm =⇒ x1 · · · xm ,
と導出される(た だし hxi ∈ N).すると明らかに ,
∗
∗
∗
G
G
G
σ =⇒ hx1 · · · hxm =⇒ σx1 · · · σxm =⇒ w1 · · · wm .
を生成でき る.以上に より主張 1 は示された .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 VI
主張 2. L(G) ⊆ τ(L).
∗
∗
∗
今度は σ ⇒ w (w ∈ T ) から始めよう .た だし , w ∈ T である.
もし w = λ ならば,σ → λ も P に 含まれるの で主張は示される.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 VI
主張 2. L(G) ⊆ τ(L).
∗
∗
∗
今度は σ ⇒ w (w ∈ T ) から始めよう .た だし , w ∈ T である.
もし w = λ ならば,σ → λ も P に 含まれるの で主張は示される.
そ う でなけ れば, G を構築すれば, w の 導出が以下の 通りである
こ とが確認される.
∗
∗
G
G
σ =⇒ σx1 · · · σxm =⇒ w .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 VI
主張 2. L(G) ⊆ τ(L).
∗
∗
∗
今度は σ ⇒ w (w ∈ T ) から始めよう .た だし , w ∈ T である.
もし w = λ ならば,σ → λ も P に 含まれるの で主張は示される.
そ う でなけ れば, G を構築すれば, w の 導出が以下の 通りである
こ とが確認される.
∗
∗
G
G
∗
σ =⇒ σx1 · · · σxm =⇒ w .
構成法より,式 (1) で示し た 通り, σ =⇒ x1 · · · xm であるこ とが
G
わかっ ている.
さらに ,すべての i = 1, . . . , m に 対し て, w = w1 · · · wm かつ
∗
∗
σxi =⇒ wi となるよう な文字列 w1 , . . . , wm ∈ T が存在する.
G xi
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 VII
以上より wi ∈ τ(xi ) であり,よっ て w ∈ τ(L) が示された .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 VII
以上より wi ∈ τ(xi ) であり,よっ て w ∈ τ(L) が示された .
最後に ,主張 1 と 2 を合わせ て,
τ(L) = L(G)
を得る.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
代入に 関する 閉包 VII
以上より wi ∈ τ(xi ) であり,よっ て w ∈ τ(L) が示された .
最後に ,主張 1 と 2 を合わせ て,
τ(L) = L(G)
を得る.
我々の 定理は,次の 好まし い系を持つ.
系2
CF は凖同型写像に 関し て閉じている.
(証明) 凖同型写像は代入の 特殊な形なの で,すべての 単一要素の
部分集合が文脈自由であるこ とを議論すれば十分である.し かし
こ れは自明である.なぜならば,すべての 有限な言語は REG に
属するこ とと, REG ⊆ CF であるこ とは,すでに 証明し ている.
よっ てこ の 系は正し い.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
ダ イク言語 I
文脈自由言語の 講義を始める際に 強調し た こ とは,多く の プログ
ラミング言語では,複数の 種類の バランスの 取れた 括弧を使用す
るという こ とである.し た がっ て,括弧からなる言語をもっ と詳
し く 見ていこ う .そ の よう な言語はダイク言語 (Dyck languages)
と呼ばれている.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
ダ イク言語 I
文脈自由言語の 講義を始める際に 強調し た こ とは,多く の プログ
ラミング言語では,複数の 種類の バランスの 取れた 括弧を使用す
るという こ とである.し た がっ て,括弧からなる言語をもっ と詳
し く 見ていこ う .そ の よう な言語はダイク言語 (Dyck languages)
と呼ばれている.
ダイク言語を定義するた めに , 以下の 記法が必要である.
n ∈ N+ とし ,
Xn = {a1 , a1 , a2 , a2 , . . . , an , an } .
とする.Xn は,相異なる括弧記号の 集合であっ て, ai は開く 括
弧,ai はそ れに 対応する閉じる括弧である.つまり Xn は n 種類
の 異なる括弧記号の 集合である.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
ダ イク言語 II
以上でダイク言語を定義する準備が整っ た .
定義 4
次の 条件を満た すとき ,言語 L は n 種類の 括弧記号からなるダ イ
ク言語 (Dyck language) であると言う .そ の 条件は,文法
Gn = [Xn , {σ}, σ, Pn ],た だし ,
Pn = {σ → λ, σ → σσ, σ → a1 σa1 , . . . , σ → an σan }
に より生成される言語 Dn と, L が同型 (isomorphic) なこ とで
ある.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
ダ イク言語 II
以上でダイク言語を定義する準備が整っ た .
定義 4
次の 条件を満た すとき ,言語 L は n 種類の 括弧記号からなるダ イ
ク言語 (Dyck language) であると言う .そ の 条件は,文法
Gn = [Xn , {σ}, σ, Pn ],た だし ,
Pn = {σ → λ, σ → σσ, σ → a1 σa1 , . . . , σ → an σan }
に より生成される言語 Dn と, L が同型 (isomorphic) なこ とで
ある.
ダイク言語の 重要性は,こ の 後すぐ明らかに なる.なぜならば,
我々はこ れを用いて,文脈自由言語の 美し い特徴を示す定理を証
明するからである.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 I
定理 3 (Chomsky-Schützenberger の定理)
すべての 文脈自由言語 L に 対し て,以下の 式が成り立つよう な,
n ∈ N+ と凖同型写像 h と正規言語 RL が存在する.
L = h(Dn ∩ RL ) .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 II
(証明) 任意の 1つの 文脈自由言語 L を考え る.こ こ で λ < L を仮
定し ても一般性は失われない.さらに , L = L(G) であるよう な
チョムスキー標準形の 文脈自由文法 G = [T , N, σ, P] を考え る.
T = {x1 , . . . , xm } とし て, P に 含まれるすべての 生成規則を考え
る.G はチョムスキー標準形であるから, すべての 生成規則は
hi → hi0 hi00 また は hj → x の 形をし ている.非終端の 生成規則
(すなわち hi → hi0 hi00 )の 総数を t とする.なお,そ の よう な生
成規則から任意の 2 つを選んだとき ,全部ではないがいく つかの
非終端記号が重複するこ とは, 当然あり得る.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 III
全部で m 個の 終端記号と t 個の 生成規則がある.そ こ で,以下の
アルファベットに 対するダイク言語 Dm+t を作っ てみよう .
Xm+t = {x1 , . . . , xm , xm+1 , . . . , xm+t ,
xm+1 , . . . , xm+t , x1 , . . . , xm } .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 III
全部で m 個の 終端記号と t 個の 生成規則がある.そ こ で,以下の
アルファベットに 対するダイク言語 Dm+t を作っ てみよう .
Xm+t = {x1 , . . . , xm , xm+1 , . . . , xm+t ,
xm+1 , . . . , xm+t , x1 , . . . , xm } .
次に ,以下の 通り定義される写像 χm+t : Xm+t −→ T ∗ を考え る.
xj , た だし 1 6 j 6 m ;
χm+t (xj ) =
λ, た だし m + 1 6 j 6 m + t .
そ し て,すべての j = 1, . . . , m + t に 対し χm+t (xj ) = λ とする.
χm+t が凖同型写像であるこ との 証明は,演習問題とし て残し て
おく .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 IV
こ こ までで,以下の 文法を定義する準備ができ た .
GL = [Xm+t , N, σ, PL ], た だし
PL = {h → xi xi | 1 6 i 6 m かつ (h → xi ) ∈ P}
∪ {h → xi xi xm+j hj00 | 1 6 i 6 m, (h → xi ) ∈ P, 1 6 j 6 t}
∪ {hj → xm+j hj0 | 1 6 j 6 t} .
明らかに GL は 正規文法である.そ こ で RL = L(GL ) とおいて,
L = χm+t (Dm+t ∩ RL ) .
を証明するこ とを目指そ う .こ れはこ の 後の 主張と補題に より示
される.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 V
主張 1. L ⊆ χm+t (Dm+t ∩ RL ).
主張 1 の 証明は主に 以下の 補題に よっ て示される.
補題 4
G は上記の L を生成する文法であるとし , GL は RL を生成する文
法であるとする.そ し て h ∈ N とする.もし も
1
1
1
1
1
G
G
G
G
G
h =⇒ w1 =⇒ w2 =⇒ · · · =⇒ wn−1 =⇒ wn ∈ T ∗
∗
ならば,h =⇒ q かつ χm+t (q) = wn となるよう な q ∈ Dm+t が
GL
存在する.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 VI
こ の 補題は,導出の 長さ n に 関する数学的帰納法で証明される.
帰納法の 基底とし て n = 1 とおく .すると,
1
h =⇒ w1 ∈ T ∗
G
と仮定される. G はチョムスキー標準形であるから,
(h → w1 ) ∈ P が言え る.し た がっ て,チョムスキー標準形の 定
義より,ある x ∈ T に 対し て w1 = x でなけ ればならない.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 VII
∗
我々は, h =⇒ q かつ χm+t (q) = x であるよう な q ∈ Dm+t が
GL
存在するこ とを示さなけ ればならない.定義より明らかに ,生成
規則 h → xx は PL に 属し ている( PL の 定義の 第 1 の 集合を参
照).よっ て,単に q = xx とし てよい.すると帰納法の 基底が示
される.なぜならば χm+t の 定義から直ちに 以下が導かれるから
である.
χm+t (q) = χm+t (xx) = χm+t (x)χm+t (x) = xλ = x .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 VIII
n > 1 に おけ る帰納法の 仮定に 基づ き ,n + 1 に 対する帰納ステッ
プを進めよう .そ こ で,
1
1
1
1
G
G
G
G
h =⇒ w1 =⇒ · · · =⇒ wn =⇒ wn+1 ∈ T ∗
という 長さ n + 1 の 導出を考え る.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 VIII
n > 1 に おけ る帰納法の 仮定に 基づ き ,n + 1 に 対する帰納ステッ
プを進めよう .そ こ で,
1
1
1
1
G
G
G
G
h =⇒ w1 =⇒ · · · =⇒ wn =⇒ wn+1 ∈ T ∗
という 長さ n + 1 の 導出を考え る.
n > 1 であっ て,導出の 長さが少なく とも 2 であるから,w1 を導
出するた めの 生成規則は h → h 0 h 00 (た だし h, h 0 , h 00 ∈ N)と
いう 形でなけ ればならない.し た がっ て,ある j が存在し て,
1 6 j 6 t かつ h = hj かつ w1 = hj0 hj00 とならなけ ればならない.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 IX
以上の 考察より,ある v1 , v2 が存在し て, wn+1 = v1 v2 かつ
∗
hj0 =⇒ v1
G
かつ
∗
hj00 =⇒ v2
G
となるはず である.完全な導出の 長さが n + 1 であるから, v1 と
v2 の 導出の 長さは,ど ちらも n 以下でなけ ればならない.し た
がっ て,帰納法の 仮定を適用でき る.すなわち, q1 , q2 ∈ Dm+t
かつ χm+t (q1 ) = v1 かつ χm+t (q2 ) = v2 であるよう な文字列 q1
と q2 が存在する.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 X
さらに ,帰納法の 仮定から,以下がわかる.
∗
hj0 =⇒ q1
かつ
∗
hj00 =⇒ q2 .
GL
GL
(hj → hj0 hj00 ) ∈ P であるこ とを考慮すると,明らかに ,生成規
則 hj → xm+j hj0 は PL に 含まれる.よっ て,
1
∗
GL
GL
h = hj =⇒ xm+j hj0 =⇒ xm+j q1
は正規文法の 導出である.さらに ,こ の 導出の 最後の ステップは,
次の 形をし ているはず である.
1
xm+j q10 hk =⇒ xm+j q10 xx .
GL
た だし 生成規則 hk → xx が適用されており, x は条件
q1 = q10 xx を満た すもの とする.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 XI
こ こ で最後の ステップを,こ れもまた PL に 属する 生成規則
hk → xxxm+j hj00 で置き 換え ると,
1
∗
GL
GL
h = hj =⇒ xm+j hj0 =⇒ xm+j q1 xm+j hj00
∗
=⇒ xm+j q1 xm+j q2 =: q ∈ Dm+t .
GL
が得られる.Dm+t に 属するの は,ダイク言語の 定義に 加え , q1
の 回りに 括弧 xm+j と xm+j が正し く 使われているこ と,および ,
q2 ∈ Dm+t であるこ とに よる.最後に χm+t の 定義より
χm+t (xm+j q1 xm+j q2 ) = v1 v2 であるこ とは確かである.以上に
より補題が証明され, h = σ に 対し て直ちに 主張 1 が示される.
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 XII
主張 2. L ⊇ χm+t (Dm+t ∩ RL ).
こ れもまた ,次に 述べる補題に より証明する.
補題 5
G は先に 定めた L を生成する文法であるとし , GL は RL を生成す
る文法であるとする.そ し て h ∈ N とする.もし も
1
1
1
GL
GL
GL
h =⇒ w1 =⇒ · · · =⇒ wn ∈ Dm+t
∗
ならば h =⇒ χm+t (wn ) である.
G
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 XIII
こ の 補題は,導出の 長さに 関する数学的帰納法で 証明される.帰
納法の 基底とし て n = 1 とする.
1
h =⇒ w1 ∈ Dm+t .
GL
を考え ると, (h → w1 ) ∈ PL となるはず である.し た がっ て,
w1 = xi xi , 1 6 i 6 m かつ (h → xi xi ) ∈ PL となるよう な xi xi
が必ず 存在する. PL の 定義より, (h → xi ) ∈ P が言え る.し た
がっ て,
1
h =⇒ xi = χm+t (xi xi ) = χm+t (w1 ) .
G
以上で帰納法の 基底が示された .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
チ ョ ムスキー ・シ ュツェンベルガ ー の定理 XIV
帰納ステップはテキストに 示されている.
主張 2 は, h = σ に 対する補題より直接導かれる.
主張 1 と主張 2 を合わせ て,定理が示された .
計算理論
c
Thomas
Zeugmann
代入と準同型写像
凖同型の 特徴づ け
おわり
Thank you!
計算理論
c
Thomas
Zeugmann