配布プリント - 東北大学 大学院 情報科学研究科 数学教室

24(2012) 年度
数理統計学
尾畑伸明
東北大学大学院情報科学研究科
http://www.math.is.tohoku.ac.jp/~obata
水曜日のクラス (1 講時:C106) 4 月 11 日∼
木曜日のクラス (2 講時:C206) 4 月 12 日∼
● 授業の目的と概要
不確実な予測しかできない状況で合理的な意思決定するときに必要となるのが, 確率・統
計のアイデアである. 授業では, 確率モデルの考え方になじみながら, 確率論の基礎概念の理
解を深め, 統計学への応用を見る. 基本的な事項としては次のようなものである.
1. 確率モデルと確率空間
2. 条件付確率と事象の独立性
3. 確率変数とその分布
4. 多次元の確率分布
5. 極限定理
6. 推定論
7. 仮説検定
学習の到達目標は, これらの事項を理解し, 自ら応用できるようになることである.
● 参考書
1. 拙著「確率統計要論」牧野書店, 2007
過年度の講義を中心に纏めたもの (ここからトピックスを選んで講義する).
2. P. G. Hoel「入門数理統計学」培風館, 1995.
3. ウェッブページの講義ノート等
上記ウェッブページから「全学教育ニュース」に飛んでください. 過年度の試験問題・
レポート問題なども閲覧できる.
● さらに参考にするなら
1. 逆瀬川浩孝「理工基礎 確率とその応用」サイエンス社
この本はなかなか面白い. 講義の題材として取り上げる部分もあるかもしれない.
2. 小川重義・森真「現象から学ぶ確率論入門」講談社サイエンティフィック
性格としては, 上の本に似ているが, こちらは確率論の主要概念に主眼がある.
ii
3. 和達三樹・十河清「キーポイント確率統計」岩波書店
システマティックに勉強するのにはあまり適さないが, ここぞというポイントをおさえ
るヒントになる.
4. F. フェラー (河田龍夫他訳) 「確率論とその応用」紀伊国屋
易しいことから高度なことまで, 実に内容豊富. 世界中の確率論研究者のバイブル.
5. 吉田伸生「確率の基礎から統計へ」遊星社
出たばかりの新しい本. 内容はとてもフレンドリーのようだ.
6. 鈴木義也・洲之内長一郎「すぐに役立つ統計」学術図書
数学の予備知識を最小にして統計学の初歩をおさえることを主眼としている.
7. 楠岡成雄「確率・統計」森北出版
この本は, 薄くて手軽に見えるが, 内容はかなり興味深い.
8. 神永正博「ウソを見破る統計学」講談社ブルーバックス
気楽な読み物として, 統計学の使われ方を概観する.
● 成績評価について
1. 期末試験 (75%位) と平常点 (25%位) により評価する. 60 点が合格基準である.
2. 期末試験:水曜日のクラス=7 月 20 日, 木曜日のクラス=7 月 21 日 (暫定. 後日確定す
る).
試験は 1 回だけ実施する. 病欠などの特別な事情があれば, 公式の手続きによって追試
験を行うが, 遅刻・欠席 (クラブ活動等の欠席を含む)・成績不良などを理由に再試験を
行うことはない.
3. 平常点は, ミニットペーパーの提出・レポートなどによる.
● 平常点
1. ミニットペーパーの提出 (出席点)
— 教師は学生個々の言語レベルに合わせて話すことはできない. 数学の専門用語や記
号などで分からないことがあれば, その場で質問するのがよい. が, 質問しにくい状況
もあるやに思う. というわけで, どんなに稚拙と思われる質問でも遠慮せずに書いてく
ださい. できるだけ, 次回の授業やウェッブページで回答する.
— 授業に関係ない質問でも, 気が向けば回答します. 質問でなくても (気の利いた) コ
メントを歓迎する (1∼2 点). ただし, 代筆が判明した場合 (だいたいすぐばれる), 関係
者は全員 0 点とする.
2. レポートまたは小テスト
— 詳細は決めていないが, 1 回くらい実施する予定. 提出したレポートが他人のレポー
ト・本・ウェッブページ等のコピーであると認定された場合, 関係者は全員 0 点とし,
口頭試問を課す.
1
第 1 章 序論:確率モデル
1.1
なぜ確率モデルを学ぶのか
(1) 役に立つ
不十分なデータからの状況予測や意思決定を合理的に行う.
(2) 様々な現象の統一的理解
抽象理論の強み. ある事例のモデルが, 全く違う現象に応用できる.
(3) 面白い
確率論は, 数学の中にあって比較的若い分野であり, これからも発展する.
1.2
組合せ確率論
起こりうるすべての結果を最小単位 (根元事象) に分解し, 根元事象の全体を Ω とする. 今,
問題になっている事象もまた根元事象の集まり E として表される. E ⊂ Ω である. すべて
の根元事象が等確率で起こるとき (これは議論の前提), E の起こる確率は
P (E) =
|E|
|Ω|
で与えられる. | · | は集合の元の個数である.
組合せの個数を数え上げて, 比を取る計算に帰着する. これが組合せ確率論の所以である.
当然, Ω は有限集合であることが前提である.
例 題 1.1 (コイントス) ベルヌイ試行ともいう (ヤコブ・ベルヌイ 1654–1705).
最も基本的な確率モデル (ベルヌイ型確率変数). しかし, バカにはできない. 極めて多くの確
率モデルはコイントスの組合せで構成される.
例 題 1.2 トランプのカード 52 枚から 2 枚を同時に抜き取るとき, その 2 枚がともに絵札
(A,K,Q,J) である確率を求めよ.
問 1 硬貨を 10 枚投げる時, 表が少なくとも 1 枚出る確率を求めよ.
1023/1024
第 1 章 序論:確率モデル
2
問 2 52 枚のトランプから 2 枚を同時に抜き出したとき, 2 枚ともエースになる確率を求めよ.
4 枚を同時に抜き出し 4 枚ともエースになる確率はどうか?
1/221, 1/270725
● 樹形図の応用
例 題 1.3 10 本中あたりが 2 本含まれているくじがある. このくじを 2 人が順に引くとき, 1
番目に引く人があたりを引く確率, 2 番目に引く人があたりを引く確率を求めよ.
問 3 10 本中あたりが 2 本含まれているくじがある. このくじを 3 人が順に引くとき, 3 番目
に引く人があたりを引く確率を求めよ.
[2/10]
問 4 10 本中あたりが 2 本含まれているくじがある. このくじを 10 人が順に引くとき, 10 番
目に引く人があたりを引く確率.
[2/10]
例 題 1.4 (車とヤギ) アメリカのテレビで話題になり議論百出 (映画「ラスベガスをぶっと
ばせ」にもあった). 3 つの扉があり, いずれかの扉の後ろに車 (高級ね) と残りの 2 つの扉の
後ろにはヤギがいる. 君はいずれかの扉を選んで, あたれば車がもらえる. 君は 1 つの扉を
選んだ. 司会者は, 「ヒントを差し上げましょう」と言って, 1 つの扉をあけヤギを逃がした
(もちろん司会者は車のある扉を開けたりしない). そしてこう言う「今なら扉を選びなおし
てもいいですよ」君ならどうする?
例 題 1.5 (パスカル–フェルマの分割問題) A,B の 2 人がゲームをする. これまでの実績か
ら A の勝つ確率は 2/5, B の勝つ確率は 3/5 である. ゲームはどちらかが先に 4 勝した段階
で終わり, 賞金 10000 ユーロを受け取る. A が 3 勝, B が 2 勝した段階でゲームを中止する
こととなった. 賞金はどのように配分するのが公平であるか? [仮想的にゲームを継続して勝
敗をつけることで分配金を決める.]
1.3
確率論小史
カルダノ (1501–1576)
ガリレオ (1564–1642)
パスカル (1623–1662) とフェルマ (1601–1665) の往復書簡 (組合せ論的確率論の祖)
ベルヌイ (1654–1705) 大数の法則の証明
ラプラス (1749–1827) 解析的確率論 (微分積分学との融合による一大発展)
「確率の解析的理論」(伊藤・樋口訳) 共立
「確率の哲学的試論」上記の内容を一般向けに解説した啓蒙書. 岩波文庫にある.
コルモゴロフ (1903–1989) の公理系 (現代確率論の祖)
「確率論の基礎概念」(根本訳) 東京図書
レヴィ(1886–1971), ウィナー (1894–1964) ブラウン運動, 確率過程
伊藤清 (1915–2008) 時間とともに変化するランダム現象の確率解析 (確率微分方程式)
3
第 2 章 確率空間
2.1
ランダム現象から確率モデルへ
ランダム現象のモデル化の第一歩は 3 つの構成要素を把握すること:
Ω: 標本空間 (見本空間) = 根元事象 (標本点, 見本点ともいう )の集合
F: 事象の集合 (確率は事象に対して与える)
P : 確率の与え方をできるだけ一般式で表す
例 題 2.1 (組合せ確率) 根元事象が有限個のときは, Ω が有限集合になる. いずれの根元事
象も等確率で起こることが想定されるなら, 事象 E の起こる確率は
P (E) =
|E|
,
|Ω|
| · | は集合の元の個数.
例:コイントスやサイコロ振りの確率モデル
例 題 2.2 (Ω が可算集合 (番号付けできる無限集合) のとき) バス停に並んでいる人の数, 栗
ようかんに含まれる栗の個数など, 個数を問題にするとき典型的に現れる.
例 題 2.3 (Ω が連続無限集合のとき) 棒をランダムに折って長いほうの断片の長さをはか
る. 長いほうの長さは短いほうの 2 倍以上になる確率.
s
例 題 2.4 線分から 1 点を選ぶとき, どの点も同程度の確からしさで選ばれることを想定す
ると (民主的ですね), 特定の点が選ばれる確率は 0 になる.
例 題 2.5 (ダーツ) 的の特定の領域に当たる確率.
第 2 章 確率空間
4
● 確率の定め方の原理 Ω における E の占める割合.
|E|
P (E) =
,
| · | は集合の「大きさ」.
|Ω|
集合の「大きさ」の測り方は様々である. 個数, 長さ, 面積, 体積, . . . .
問 5 ある 2 人は正午から午後 1 時の間に 10 分間だけ公園に立ち寄るのが日課である. ただ
し, 公園に到着する時刻はお互いにランダムであるとする. この 2 人が公園で遭遇する確率
を求めよ (確率モデルを明確に作り, それをもとに計算すること).
2.2
確率空間
定義 事象 E に対して数値 P (E) が定められていて, 次の 3 性質をみたすとき, P を標本
空間 Ω 上の確率という. また, P (E) を E の起こる確率という.
(i) 0 ≤ P (E) ≤ 1.
(ii) P (Ω) = 1.
(iii) [可算加法性] E1 , E2 , · · · ∈ F が互いに素 (つまり, i ̸= j ならば Ei ∩ Ej = ∅) ならば,
(∞
)
∞
∪
∑
P
En =
P (En ).
n=1
n=1
このとき, 3 点セット (Ω, F, P ) を確率空間という.
注意 事象は標本空間 Ω の部分集合なので, 事象には集合の演算記号を用いる.
部分事象・空事象・全事象・余事象・和事象・積事象・排反な事象
ただし, E ⊂ F は E = F も許す. 不等式 a < b の使い方とは違うので注意せよ.
2.3
ベルトランのパラドックス
単位円にランダムに引かれた弦 AB の長さが
する正 3 角形の辺の長さである.)
√
√
3 を越す確率を求めよ. (なお, 3 は内接
B
A
O
ポイント: ベルトランのパラドックスにおいて, 「単位円にランダムに弦を引く」際に考
えるべき根元事象 (標本) および標本空間は何か? ベルトランのパラドックスとは確率モデル
の違いに他ならない.
2.3. ベルトランのパラドックス
5
第 1 章∼第 2 章の演習問題 (じっくり考える問題)
演習問題 1 52 枚のトランプから同時に 5 枚を抜き出すとき, 次の確率を求めよ.
(1) ロイヤルストレートフラッシュ(同じスートで A,K,Q,J,10) ができている確率
(2) フォーカードができている確率
(3) ワンペアができている確率
演習問題 2 0 から 9 までの数字を 5 個並べて作った乱数 00000, 00001, . . . , 99999 のうち 1 つ
を考える.
(1) 選ばれた乱数に 9 がちょうど 1 個含まれる確率を求めよ.
(2) 選ばれた乱数に 9 がちょうど 2 個含まれる確率を求めよ.
(3) 選ばれた乱数に 0, 1, . . . , 9 のうち少なくとも 1 つがちょうど 2 個含まれる確率を求めよ.
(4) 選ばれた乱数に 0, 1, . . . , 9 のうち少なくとも 2 つがちょうど 1 個含まれる確率を求めよ.
演習問題 3 (学生さんのコメントから改題) 1□2□3□4□5 の □ に + または − のいずれか
をランダムに選んで数式を作るとき, その答えが 3 の倍数になる確率を求めよ.
演習問題 4 A,B の 2 人がゲームをする. これまでの実績から A の勝つ確率は p, B の勝つ確
率は q = 1 − p である. ゲームはどちらかが先に 5 勝した段階で終わり, 賞金 10000 ユーロ
を受け取る. A が 3 勝, B が 2 勝した段階でゲームを中止することとなった. 賞金はどのよ
うに配分するのが公平であるか?
演習問題 5 棒をランダムに折って 2 本の断片を作るとき, 長いほうの長さが短いほうの 3 倍
以上ある確率を求めよ.
演習問題 6 直角二等辺三角形の内部に 1 点 P をランダムに選び, 直角をはさむ 2 本の等辺
に P から垂線を下ろして長方形を作る. この長方形の面積が直角二等辺三角形の面積の 1/3
以上になる確率を求めよ.
7
第 3 章 確率変数
3.1
例から定義へ
ランダム現象の観測結果を数値化することで, さまざまな数値処理が施され計量的な判断
が可能になる. ランダム現象で起こった結果 (根元事象) に対して数値を対応させるのが「確
率変数」である.
例 題 3.1 コインを投げて表が出たら 1, 裏が出たら 0 を対応させる.
例 題 3.2 サイコロ投げで出た目をそのまま値とする.
例 題 3.3 コインを 5 回投げて表の出た回数を数える.
例 題 3.4 棒をランダムに折って長いほうの断片の長さをはかる.
例 題 3.5 円の内部から 1 点をランダムに選んだとき, その点と中心との距離をはかる.
1) 離散型確率変数
2) 連続型確率変数
変数と確率変数 ある範囲を動くことが想定されている実数のことを数学用語で (実) 変数と
いう. 文字の使い方は自由ではあるが, 変数には x, y, z, t, . . . などがよく用いられる. たとえ
ば, 0 ≤ x ≤ 1 とあれば, x は 0 以上 1 以下の範囲にある実数を代表する変数と理解される.
ランダム現象を観測して得られる観測値は, 偶然の影響のために定数ではなく, ある範囲を
動く変数となる. しかも, どの値が出やすく, どの値が出にくいといった確率的な傾向が付加
されている. このような変数を確率変数という. 習慣によって, 確率変数には X, Y, Z, T, . . .
のように大文字を用いる.
第 3 章 確率変数
8
3.2
離散型確率変数の分布
例 題 3.6 サイコロ投げで得られる観測値を X とすると, X は {1, 2, 3, 4, 5, 6} の範囲を動
く確率変数である. ふつう
P (X = 1) = P (X = 2) = · · · = P (X = 6) =
1
6
のように書くことで, 値の出やすさの確率的な傾向を明らかにする.
例 題 3.7 長さ L の棒をランダムに折ってできる, 長いほうの断片の長さを X とする. X
は L/2 ≤ X ≤ L の範囲を動く確率変数である. しかし, 特定の値 x に対しては, 常に,
P (X = x) = 0
であるから, 例題 3.6 のようには, 値の出やすさの確率的な傾向を表すことができない.
定義 X を確率変数とするとき,
F (x) = P (X ≤ x),
x ∈ R,
で定まる関数を X の分布関数という. 分布関数の定義域は実数全体である.
例 題 3.8 コインを投げて表が出たら 1, 裏が出たら 0 を対応させる確率変数を X とする.
X の分布と分布関数を求めよ.
問 6 コイン 2 枚同時に投げたときの表の枚数を X とする. X の分布と分布関数を求めよ.
問 7 図のようなダーツで白色の領域に当たれば 100 円, 黒色の領域に当たればはずれ (0 円)
もらえる. このゲームを 2 回行うとき, 獲得賞金を X とする. X の分布と分布関数を求めよ.
3.3
連続型確率変数の分布
例 題 3.9 棒をランダムに折ってできる長いほうの断片の長さ X の分布関数
問 8 棒をランダムに折ってできる短いほうの断片の長さ X の分布関数
3.4. 確率分布の一般的な性質
9
定 義 3.1 連続型確率変数 X に対して,
∫
P (X ≤ x) = F (x) =
x
⇐⇒
f (t)dt
−∞
F ′ (x) = f (x)
を満たす関数 f (x) を X の確率密度関数という. (F (x) は区分的に微分可能であればよい.)
定 理 3.2
∫
P (a ≤ X ≤ b) =
b
f (x)dx
a
例 題 3.10 棒をランダムに折ってできる長いほうの断片の長さ X の密度関数を求めよ.
例 題 3.11 棒をランダムに折ってできる短いほうの断片の長さ X の密度関数を求めよ.
3.4
確率分布の一般的な性質
定 理 3.3 すべての確率変数の分布関数 F (x) は次の性質をもつ.
(1) x1 ≤ x2 ならば F (x1 ) ≤ F (x2 ).
(2) lim F (x) = 0, lim F (x) = 1.
x→−∞
x→∞
(3) lim F (x + ϵ) = F (x).
ϵ→+0
定 理 3.4 密度関数 f (x) は次の性質をもつ.
(1) f (x) ≥ 0.
∫ +∞
(2)
f (x)dx = 1.
−∞
確率分布の表し方
• 離散型確率変数の場合 (表・ヒストグラムで表される)
P (X = ai ) = pi
• 連続型確率変数の場合 (密度関数または分布関数を用いる)
F (x) = P (X ≤ x)
∫ b
P (a ≤ X ≤ b) =
f (x)dx
a
11
第 4 章 基本的な確率分布
4.1
4.1.1
離散分布
二項分布
表が出る確率が p であるコインを n 回投げたとき, 表の出る回数 X の分布
( )
n k
P (X = k) =
p (1 − p)n−k ,
k = 0, 1, 2, . . . .
k
この分布を二項分布といい, B(n, p) で表す.
例 題 4.1 B(4, 1/2) と B(4, 1/4) を図示せよ.
4.1.2
幾何分布
表が出る確率が p であるコインを投げ続けるとき, 表が初めて出るまでに出た裏の回数 X
の分布は
P (X = k) = p(1 − p)k ,
k = 0, 1, 2, . . . .
この分布をパラメータ p の幾何分布という. (待ち時間の分布として重要)
補注 文献によっては, 表が出る確率が p であるコインを投げ続けるとき, 表が初めて出る
までに要したコイン投げの回数 (表が出た回も 1 回と数える) Y の分布を幾何分布といって
いる.
P (Y = k) = p(1 − p)k−1 ,
k = 1, 2, . . . .
4.1.3
ポアソン分布
確率変数 X がパラメータ λ > 0 のポアソン分布に従うとは,
P (X = k) =
λk −λ
e ,
k!
k = 0, 1, 2, . . . .
第 4 章 基本的な確率分布
12
例 題 4.2 λ = 0.5, λ = 1, λ = 2 のときのポアソン分布を図示せよ.
例 題 4.3 栗ようかんに入っている栗の個数
問 9 栗ようかん 1 本には平均 3 個の栗が入っているという.
(1) 栗ようかん 1 本にまったく栗が入っていない確率を求めよ.
(2) 栗ようかん 1 本に栗が 5 個以上入っている確率を求めよ.
4.1.4
平均値と分散
離散型確率変数 X のとりうる値を {a1 , a2 , . . . , } として, pi = P (X = ai ) とおくと,
∑
pi ≥ 0,
pi = 1
i
が成り立つ (pi = 0 となる ai を除外しても分布としての本質は同じであるが, pi = 0 を排除
しないほうが一般性が保てるので計算が楽). このような分布に対して, 平均値と分散が
∑
∑
∑
m=
ai pi ,
σ2 =
(ai − m)2 pi =
a2i pi − m2
i
i
i
で定義される.
確率変数 X の確率分布の平均値, 分散を単に確率変数 X の平均値, 分散といい, E[X],
V[X] で表す. 分散の正の平方根を標準偏差という.
確率分布
平均値 (m)
分散 (σ 2 )
ベルヌイ分布 (2 点分布) B(1, p)
p
p(1 − p)
二項分布 B(n, p)
np
np(1 − p)
幾何分布 (パラメータ p)
(1 − p)/p
(1 − p)/p2
ポアソン分布 (パラメータ λ)
λ
λ
問 10 コインを 2 回投げるとき, 2 回ともに表なら 100 円, 1 回だけ表なら 50 円, 2 回とも裏
なら 10 円もらえるゲームを考える. このゲームを 1 回するとき, もらえる平均金額を求めよ.
問 11 コインを 10 回投げるとき, 表が出る枚数の平均値, 分散, 標準偏差を求めよ.
問 12 1000 本に 1 本当たりが入っている宝くじが毎週売り出される. 毎週 1 本買うとして,
あたりを引くまでに要する平均待ち時間を求めよ.
4.2. 連続分布
4.2
13
連続分布
確率密度関数で表す. 確率密度関数 f (x) は,
∫
f (x) ≥ 0,
+∞
f (x) = 1
−∞
を満たす.
4.2.1
一様分布

 1 , a≤x≤b
f (x) = b − a
0,
その他
1) 区間 [a, b] からどの点も同等な確からしさで 1 点を選ぶときのモデルとして現れる.
2) 長さ L の棒をランダムに折ってできる長いほうの断片の長さ X は, [L/2, L] 上の一様
分布に従う.
4.2.2
指数分布
λ > 0 を定数として
f (x) =
{
λe−λx , x ≥ 0
0,
x<0
ランダム到着の待ち時間をモデル化するときに現れる.
4.2.3
正規分布 (ガウス分布)
N (m, σ 2 ): 平均 m, 分散 σ 2 の正規分布 (またはガウス分布)
{
}
(x − m)2
1
exp −
f (x) = √
2σ 2
2πσ 2
N (0, 1): 標準正規分布
● 他に, χ2 -(カイスクエア) 分布, t-分布, F -分布 (後出)
第 4 章 基本的な確率分布
14
4.2.4
平均値と分散
確率密度関数 f (x) であらわされる確率分布の平均値と分散は
∫ ∞
∫ ∞
∫ ∞
2
2
m=
xf (x) dx,
σ =
(x − m) f (x) dx =
x2 f (x) dx − m2
−∞
−∞
−∞
で定義される.
確率変数 X の確率分布の平均値, 分散を単に確率変数 X の平均値, 分散といい, E[X],
V[X] で表す. 分散の正の平方根を標準偏差という.
確率分布
平均値 (m)
分散 (σ 2 )
[a, b] 上の一様分布
(a + b)/2
(b − a)2 /12
指数分布 (パラメータ λ)
1/λ
1/λ2
正規分布 N (m, σ 2 )
m
σ2
例 題 4.4 長さ L の棒をランダムに 2 分割したとき, 長い方の断片の長さを X とする. X の
分布関数, 密度関数, 平均, 分散を求めよ.
問 13 長さ L の棒をランダムに 2 分割したとき, 短い方の断片の長さを X とする. X の分
布関数, 密度関数, 平均, 分散を求めよ.
問 14 積分を計算して, 指数分布の平均値と分散を求めよ.
4.2. 連続分布
15
第 3∼4 章の演習問題 (やや高度)
演習問題 7 (確率母関数) {0, 1, 2, . . . } に値をとる離散型確率変数 X に対して,
G(z) =
∞
∑
z k P (X = k)
k=0
を X の (または X の確率分布の) 確率母関数という. このとき,
E(X) = G′ (1),
E(X 2 ) = G′′ (1) + G′ (1),
V(X) = G′′ (1) + G′ (1) − G′ (1)2 .
演習問題 8 確率母関数を用いて, 幾何分布の平均値と分散を求めよ.
演習問題 9 確率母関数を用いて, ポアソン分布の平均値と分散を求めよ.
演習問題 10 サイコロを 2 個投げて出た目のうち大きい方 (同じ目のときはその目) を X, 小
さい方 (同じ目のときはその目) を Y とする. X と Y の平均値と分散を求めよ.
演習問題 11 積分を計算して, 正規分布の平均値と分散を求めよ. ただし, 公式 (重積分の応
用として有名)
∫ +∞
√
2
e−x dx = π
−∞
は既知としてよい.
演習問題 12 単位円の内部から 1 点をランダムに選んだとき, その点と中心との距離 X は
連続型の確率変数になる. この X の分布関数, 密度関数, 平均値, 分散を求めよ.
演習問題 13 中心を O とする半径 R の円の内部にランダムに 1 点を選び, その点を通る中
心を O とする円の面積を X とする. X の分布関数, 密度関数, 平均, 分散を求めよ.
17
第 5 章 条件付確率
条件付確率
5.1
A, B を 2 つの事象とする. P (A) > 0 のとき, A の下での B の条件付確率
P (B|A) =
P (A ∩ B)
P (A)
例 題 5.1 (くじ引き) 箱の中に 10 本の三角くじが入っていて, そのうち 2 本が当たりとなっ
ている. 2 人が順番に 1 本ずつくじを引くとき, 先に引くのが有利か, 後のほうが有利か? 条
件付確率を用いて考察せよ.
問 15 2 つの事象 E, F に対して, P (E) =
の確率を求めよ.
P (E c ),
5.2
5.2.1
P (E ∩ F c ),
1
1
1
, P (F ) = , P (E ∩ F ) = がわかっている. 次
3
2
4
P ((E ∪ F c )c ),
P (E|F ),
P (E|F c ),
P (E ∩ F |E ∪ F )
無記憶性
幾何分布の無記憶性
T を幾何分布に従う確率変数とするとき,
P (T ≥ m + n|T ≥ m) = P (T ≥ n),
m, n = 0, 1, 2, . . . ,
が成り立つ.
5.2.2
指数分布の無記憶性
X を指数分布に従う確率変数とするとき,
P (X ≥ a + b|X ≥ a) = P (X ≥ b),
が成り立つ.
a, b ≥ 0,
第 5 章 条件付確率
18
5.3
ベイズの公式
Ω = A1 ∪ A2 , A1 ∩ A2 = ∅ のとき, 任意の事象 B に対して,
P (A1 |B) =
P (A1 )P (B|A1 )
P (A1 )P (B|A1 ) + P (A2 )P (B|A2 )
「結果から原因を知る公式」としての解釈 (事前確率の設定に注意).
例 題 5.2 ある国では, 病気 A の感染者は 500 人に 2 人の割合であるという. 検査 B は, 感
染者の 95%に陽性反応を示すが, 非感染者の 2% にも陽性反応が出てしまう. ある人がこの
検査を受けて陽性反応が出た. この人が感染者である確率を求めよ.
問 16 例題 5.2 において, 病気 A の感染者は 1000 人に 2 人の割合であったときはどうなるか?
演習問題 14 ある国では, 病気 A の感染者は 500 人に 2 人の割合であるという. 検査 B は,
感染者の 95%に陽性反応を示すが, 非感染者の 100p % にも陽性反応が出てしまう. ある人
がこの検査を受けて陽性反応が出た. この人が感染者である確率を求めよ. この確率が p と
ともにどのように変化するかを考察せよ.
演習問題 15 5 人から 2 人の委員を選ぶことになった. そこで, 5 枚のカードを用意して, そ
のうちの 2 枚にあたりと書いたくじをつくり, 5 人が順に引くこととした. 委員になりたくな
い人は何番目に引くのがよいだろうか? (2 人の委員を決めるのが目的であるから, 一度引か
れたカードは元に戻さない.)
演習問題 16 2 つの事象 E, F に対して, P (E) =
いる. 次の確率を求めよ.
P (E c ),
P (E ∩ F c ),
P ((E ∪ F c )c ),
1
1
2
, P (F ) = , P (E ∪ F ) = がわかって
3
2
3
P (E|F ),
P (E|F c ),
P (E ∩ F |E ∪ F )
演習問題 17 (条件付き確率は直感にあわないかも) 1 から 10 の番号が付いている 10 枚のチ
ケットがある. このうち 1 番と 2 番が当たりくじとなっている. 一郎は 4 枚のチケットを
買った.
(1) 一郎は 1 番をもっていると告げた. このとき, 残りの 6 枚にあたりが残っている確率を
求めよ.
(2) 一郎は少なくとも 1 枚の当たりをもっていると告げた. このとき, 残りの 6 枚にあたり
が残っている確率を求めよ.
19
第 6 章 正規分布
6.1
標準正規分布
N (0, 1): 標準正規分布
例 題 6.1 確率変数 Z の分布が標準正規分布である (このことを Z ∼ N (0, 1) と書く) とす
る. 標準正規分布表を用いて,
(1) 次の確率を求めよ: P (Z ≤ 1.15),
P (Z ≤ −1.23),
P (|Z| < 2.4)
(2) 次の等式が成り立つような a を求めよ.
P (Z ≥ a) = 0.33,
P (Z < a) = 0.75,
P (|Z| ≥ a) = 0.4
問 17 Z ∼ N (0, 1) とする.
(1) 次の確率を求めよ: P (Z ≥ 1.82),
P (Z ≥ −2.13),
P (|Z| > 1.5)
(2) 次の等式が成り立つような a を求めよ.
P (Z ≥ a) = 0.39,
P (Z < a) = 0.91,
P (|Z| ≤ a) = 0.72
定 理 6.1 X ∼ N (m, σ 2 ) のとき,
Z=
X −m
∼ N (0, 1)
σ
例 題 6.2 X ∼ N (2, 52 ) のとき, P (X ≥ 3), P (X ≤ 0), P (|X| ≥ 4) を求めよ.
問 18 (1) 確率変数 X が正規分布 N (20, 42 ) に従うとき, P (X > 17.8) を求めよ.
(2) 確率変数 Y が正規分布 N (−2, 52 ) に従うとき, P (|Y | ≥ 1) を求めよ.
第 6 章 正規分布
20
問 19 X ∼ N (50, 102 ) のとき, P (X > a) = 0.985 を満たす a を求めよ.
補足 表にない値は (線形) 補間法で求める. つまり, x = x1 のとき y = y1 , x = x2 のとき
y = y2 はわかっているとき, x1 < x < x2 に対する y 値は次式で与える:
y=
6.2
y2 − y1
(x − x1 ) + y1
x2 − x1
ドモアブル・ラプラスの定理
B(100, 0.4)
定 理 6.2 二項分布は, 同じ平均と分散をもつ正規分布で近似できる.
B(n, p) ≈ N (np, np(1 − p)),
0 < p < 1,
n → ∞.
例 題 6.3 公平なコインを 400 回投げたとき, 表が 225 回以上出る確率を正規分布近似を用
いて求めよ (半目補正に注目).
問 20
(1) 公平なコインを 1000 回投げたとき, 表が 550 回以上出る確率を求めよ.
(2) 公平なサイコロを 250 回投げたとき, 1 の目の出る回数が 30 回以下になる確率を求めよ.
仮説検定に向けて コインを 400 回投げたとき, 表が 225 回出た. このコインは公正であると
いえるだろうか?
6.3
標本平均の分布
調査対象の集団 (母集団) に対して, 全数調査が不可能である場合に, その一部分 (標本) を
調査して全体の性質を推定することが重要である. 特に, 母集団の平均値が知りたいとき, n
個の標本を取り出し, それらの値 x1 , x2 , . . . , xn の平均
1∑
xi
n i=1
n
6.3. 標本平均の分布
21
によって母集団の平均値とみなすことは, 日常的にもよくおこなわれている. しかし, なぜこ
の方法でよいのか, 気にかけたことはあるか?
無作為復元抽出 母集団から 1 個の標本をランダムに (どの標本も同じ確率で選ばれるよう
に) 取り出してその値を考えよう. この値は確率変数であるから X と書くことにする. X の
分布を母集団分布という. 取り出した標本を元に戻して, 同じ操作で次々に標本を取り出す
ことにすれば, 1 回目の標本 X1 , 2 回目の標本 X2 , . . . , n 回目の標本 Xn のように確率変数
の列が得られる. このような標本の取り出し方を無作為復元抽出といい, X1 , X2 , . . . , Xn を
母集団から得られた n 個の無作為標本という.
注意 非復元抽出では毎回の標本調査のあと母集団が変化するが, 母集団が巨大なら「非復
元抽出 ≈ 復元抽出」と考えてよい. つまり, 母集団が巨大なら n 個の無作為標本を得たいと
きに, まとめて n 個を取り出しても実用上の誤差は無視してよい.
定 理 6.3 母集団分布の平均値が m, 分散が σ 2 であるとき, 標本平均は近似的に正規分布に
従う:
(
)
n
σ2
1∑
Xk ≈ N m,
X̄ =
.
n
n
k=1
例 題 6.4 標本数 n が大きいほど, 標本平均は母集団の平均値の推定値として優れているこ
とを説明せよ.
演習問題 18 X が標準正規分布 N (0, 1) に従う確率変数であるとき, Y = aX + b の分布関
数と確率密度関数を求めよ. ただし, a, b は定数である.
演習問題 19 X が標準正規分布 N (0, 1) に従う確率変数であるとき, Y = X 2 の分布関数と
確率密度関数を求めよ.
演習問題 20 日本人の平均年齢は 44.2 歳, 標準偏差は 23.5 歳である (2009 年 10 月). ある
サークルのメンバー 25 名の平均年齢は 32 歳である. このサークルは日本人の無作為標本と
いえるだろうか? 考察せよ.
Ҙʴ
ଐஜ↝ʴӝ‒‚․••‫‛‣†•‣†‫‬
․•••
‣‧••
‣•••
‧••
•
•
‧
‣•
‣‧
․•
․‧
‥•
‥‧
…•
…‧
‧•
‧‧
•
‧
•
‧
‪•
‪‧
‫•‫‬
‫‧‫‬
‣••
第 6 章 正規分布
22
標準正規分布表
z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
0.00
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4773
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987
0.01
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987
0.02
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.4357
0.4474
0.4573
0.4656
0.4726
0.4783
0.4830
0.4868
0.4898
0.4922
0.4941
0.4956
0.4967
0.4976
0.4983
0.4987
0.03
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.4370
0.4484
0.4582
0.4664
0.4732
0.4788
0.4834
0.4871
0.4901
0.4925
0.4943
0.4957
0.4968
0.4977
0.4983
0.4988
1
I(z) = √
2π
0.04
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.4382
0.4495
0.4591
0.4671
0.4738
0.4793
0.4838
0.4875
0.4904
0.4927
0.4945
0.4959
0.4969
0.4977
0.4984
0.4988
∫
0.05
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.4394
0.4505
0.4599
0.4678
0.4744
0.4798
0.4842
0.4878
0.4906
0.4929
0.4946
0.4960
0.4970
0.4978
0.4984
0.4989
z
e−x
2 /2
dx
0
0.06
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.4406
0.4515
0.4608
0.4686
0.4750
0.4803
0.4846
0.4881
0.4909
0.4931
0.4948
0.4961
0.4971
0.4979
0.4985
0.4989
0.07
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4979
0.4985
0.4989
0.08
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990
0.09
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990
23
第 7 章 母平均の推定
7.1
視聴率調査
テレビ局では視聴率の獲得にしのぎを削っているようである. 果たして, コンマ以下の数
字に意味はあるのだろうか?
2012 年 5 月 21 日 (月) ∼ 5 月 27 日 (日) ドラマ (関東地区) 視聴率ベスト 10
番組名
放送局
連続テレビ小説・梅ちゃん先生
鍵のかかった部屋
土曜ワイド劇場・大友鉄
日曜劇場・ATARU
37歳で医者になった僕
月曜ゴールデン・長い長い殺人
リーガル・ハイ
金曜プレステージ・花婿がみた悪魔
相棒
相棒祭り!まるごと4時間
NHK総合
フジテレビ
テレビ朝日
TBS
フジテレビ
TBS
フジテレビ
フジテレビ
テレビ朝日
テレビ朝日
∗
放送日
放送開始時刻 − 分数
05/21(月) 8:00 - 15
05/21(月) 21:00 - 54
05/26(土) 21:00 - 111
05/27(日) 21:00 - 54
05/22(火) 22:00 - 54
05/21(月) 21:00 - 114
05/22(火) 21:00 - 54
05/25(金) 21:00 - 112
05/22(火) 15:57 - 56
05/26(土) 13:59 - 121
視聴率 (%)∗
22.1
15.4
14.0
13.5
12.5
12.1
11.6
11.5
11.0
11.0
ビデオリサーチ社による番組平均世帯視聴率
日本の放送エリアは全部で 32 ありますが, それぞれの放送エリアごとに視聴率調査が行
なわれています. ビデオリサーチでは, 関東地区をはじめ全国 27 地区の調査エリアで,
PM システムによる調査とオンラインメータシステムによる調査を実施しています. (日
本全国をひとつの調査エリアとした視聴率調査は実施していません)また, 調査対象世帯
数は, PM システムによる調査の関東地区・関西地区・名古屋地区で 600 世帯, それ以外の
オンラインメータシステムによる調査地区は 200 世帯です. (ビデオリサーチ社のウェッ
ブページから. 2012.6 現在)
参考: 藤平芳紀「視聴率の正しい使い方」(朝日新書)
7.2
母平均の区間推定 (母分散が既知)
母平均 m が未知 (推定したい), 母分散 σ 2 が既知の場合を扱う.
X1 , X2 , . . . , Xn : 大きさ n の標本 (母集団分布をもつ独立同分布 (iid) の確率変数列として
理論が作られている)
第7章
24
● 標本平均
母平均の推定
1∑
Xk
n k=1
n
X̄ =
が母平均の推定量として妥当である.
(1) 不偏性: E((X̄) = m
)
(2) 一致性: P lim X̄ = m = 1 (大数の法則)
n→∞
しかし, 標本の取り方が異なれば X̄ の値 (実現値) も変化する (あたりまえ! X̄ も確率変数).
そこで, X̄ の変動を評価して, 母平均を精度もこめて推定したい.
● 変動評価のために用いる原理 (確率論では「中心極限定理」と呼ぶ)
)
(
n
1∑
σ2
X̄ =
Xk ≈ N m,
n k=1
n
したがって,
X̄ − m
√ ≈ N (0, 1)
σ/ n
⇐⇒
(
)
X̄ − m
√ ≤z =1−α
P −z ≤
σ/ n
z
α
1−α
1.00
0.317
0.683
1.64
0.100
0.900
N
1.96
0.050
0.950
2.00
0.045
0.955
2.58
0.010
0.990
3.00
0.003
0.997
3.29
0.001
0.999
㻝㻙 α
㻙z
z
定 義 母平均 m に対する信頼係数 1 − α の信頼区間
[
]
σ
σ
X̄ − z √ , X̄ + z √
n
n
区間の端点を信頼限界と呼ぶ.
信頼係数としては
90%(α = 0.1, z = 1.64)
95%(α = 0.05, z = 1.96)
99%(α = 0.01, z = 2.58)
などが習慣的に用いられる. 信頼係数・信頼区間の幅・標本数の関係に注意せよ.
7.3. 二項母集団の母比率
25
重要な注意 1 セットの標本値から信頼区間が 1 つ得られる. 標本が異なれば, 信頼区間も変
化する. そのように標本が異なれば信頼区間もいろいろ変化するが, そのうち信頼係数 1 − α
の確率で母平均 m をその信頼区間に含むのである. 信頼区間の中点が母平均に近い確率が
高く, 区間の端の方は母平均から外れている確率が高いなどということはない!
例 題 7.1 ある生産ラインで 1 万個の製品を作った. ランダムに選んだ 40 個の製品の平均重
量は 156g であった. この生産ラインの機械的特性から, 生産される製品の重量の標準偏差は
8g である. 生産した 1 万個の製品の平均重量の信頼区間を求めよ.
例 題 7.2 例題 7.1 で, 95%信頼区間の幅を 1g 以下にするためには何個の標本をとる必要が
あるか?
演習問題 21 ある工場のロットから, ランダムに 200 個の標本を選んで不純物量を測定した
とき, 平均 2.2 g の不純物が含まれていた. この工場の工程から, 不純物量の標準偏差は 1.5
g であることが経験的に知られている. このロット全体では, 不純物を平均何 g 含んでいる
といえるだろうか? 信頼区間を求めよ.
[1.992, 2.408]
注 意 一般の母集団では, 母平均, 母分散とも未知であることが多い. このときは, 母分散の
かわりに不偏分散
n
1 ∑
2
U =
(Xk − X̄)2
n−1
k=1
を用いて, 正規分布の代わりに t-分布を用いる (後出).
7.3
二項母集団の母比率
二項母集団:ある属性 E によって 2 つの集団に分かれているような母集団.
母比率: 属性 E をもつ集団の比率 p を母比率という.
X1 , X2 , . . . , Xn : 大きさ n の標本 (成功確率 p のベルヌイ確率変数列になる)
Xi =
{
1, i 番目の標本が属性 E をもつ,
0, i 番目の標本が属性 E をもたない
標本平均
1∑
Xk
n k=1
n
X̄ =
が母比率の推定値となる. 慣例によりこれを p̂ と書くことにする.
第7章
26
7.4
母平均の推定
母比率の区間推定
母比率 (母平均) p が未知 (これを推定したい).
母分散も未知であるが, 母比率がわかれば p(1 − p) として求められる (7.2 節との違い).
まず, 母分散を σ 2 = p(1 − p) として, 7.2 節の議論を適用すると, 母比率 p に対する信頼
係数 1 − α の信頼区間
√
√
]
[
p(1 − p)
p(1 − p)
√
√
p̂ − z
, p̂ + z
n
n
2 次不等式の近似 (詳細は教科書):
√
√
p(1 − p)
p̂(1 − p̂)
|p̂ − p| ≤ z
≈ |p̂ − p| ≤ z
n
n
を用いることができて, 母比率 p に対する信頼係数 1 − α の信頼区間が,
√
√
[
]
p̂(1 − p̂)
p̂(1 − p̂)
p̂ − z
, p̂ + z
n
n
として求まる.
例 題 7.3 100 回のじゃんけん勝負で 54 勝した. この人のじゃんけん勝率の信頼区間を求め
てみよう. 信頼係数 90% とすると,
√
0.54(1 − 0.54)
0.54 ± 1.64 ×
≈ 0.54 ± 0.082
100
例 題 7.4 (視聴率調査) 標本数 600 から視聴率の推定値 22% が得られた. 信頼係数 95% の
信頼区間は,
√
0.22(1 − 0.22)
0.22 ± 1.96 ×
≈ 0.22 ± 0.033
600
例 題 7.5 視聴率調査において, 信頼係数 95% の信頼区間の長さが 0.01 以下になるために
は, どれほどの標本数が必要か?
演習問題 22 ある国で内閣支持率を調査したところ 17.5% であった. 調査対象は 2000 人で
あった. 支持率の 90%信頼区間を求めよ.
演習問題 23 視聴率調査結果について, 信頼区間を求め, その順位について考察せよ.
演習問題 24 平成 18 年と平成 19 年に生まれた子供の数は以下のとおりである (厚生労働省・
人口動態統計年報)
男
女
合計
平成 19 年
559 847
529 971
1 089 818
平成 18 年
560 439
532 235
1 092 674
男の子供の方が女の子供よりも多いと言えるだろうか?統計的に考察せよ.
27
第 8 章 仮説検定
— 二項母集団の母比率
8.1
仮説検定のアイデア
例 題 8.1 コインを 400 回投げたとき, 表が 220 回出た. コインは公正といえるだろうか?
(1) 公正であると仮定して,
(2) 関連する統計量を理論的に計算して,
(3) 実際の観測結果と比較する.
8.2
検定の手順
1. 母集団の分布に関する帰無仮説 H0 と対立仮説 H1 を決める.
2. 適当な確率変数 T (検定統計量) を選び, 仮説 H0 の下で, この確率変数の分布を調べる.
3. 有意水準 0 < α < 1 と P (T ∈ W ) = α となる W ⊂ R (棄却域) を H1 を考慮して決
める.
4. 標本から T の実現値 t を計算し, W に入るかどうかを見定める.
• t ∈ W のとき. 「検定統計量 T は棄却域に落ちるので, 有意水準 α で 有意であ
る. したがって, H0 を棄却し H1 を採択する」という.
• t ̸∈ W のとき. 「検定統計量 T は棄却域に落ちないので, 有意水準 α で 有意で
はない. したがって, H0 を採択する」という.
(1) 帰無仮説は, 文字通り「無に帰する」ことを念頭において設定されるもので, 正否を知
りたいのは対立仮説のほうである.
(2) 帰無仮説の下で確率計算をすることになるのであるから, 帰無仮説は限定的に (不等式
ではなく等式で) 表現されている必要がある.
(3) 有意水準は, 問題に応じて自由に設定してよいが, 慣習で 5%, 1% が多く用いられる.
(4) 棄却域の取り方には主に 2 つあって, 両側検定と片側検定がある.
(5) 検定統計量が棄却域に落ちない場合, 「H0 を採択する」とは言うが, はっきり否定す
るだけの状況ではないという消極的な採択である (2 種類の過誤を参照). 「H0 を棄却できな
い」と言う表現もするが, このニュアンスを伝えようとするものである.
第 8 章 仮説検定
28
α
α
α
W
W
W
W
問 21 A 君は公正なコインを作成したつもりだ. 確認のため 100 回振ったところ表が 58 回
出た. このコインは公正であるといえるか.
参考:有意水準と棄却域 Z ∼ N (0, 1) のとき,
1
α = P (|Z| ≥ z) = 1 − √
2π
z
α
1−α
1.00
0.317
0.683
1.64
0.100
0.900
1.96
0.050
0.950
∫
z
e−x
2 /2
dx,
−z
2.00
0.045
0.955
2.58
0.010
0.990
z≥0
3.00
0.003
0.997
3.29
0.001
0.999
α
-z
㻜
z
例 題 8.2 ある工場で使っている機械に新しい部品を採用するかどうか考えている. 従来の
部品の寿命は 120 時間であるが, 新しい部品の寿命はそれを上回るという. そこで, 16 個の
サンプルで実際に寿命を調べたところ平均寿命は 121.2 時間であった. 部品の製造工程の管
理状況から, 新しい部品の寿命は標準偏差 2.4 時間の正規分布にしたがっているとしてよい.
新しい部品を導入する価値があるかどうかを仮説検定で検討しよう.
新しい部品の平均寿命を m とおく. 帰無仮説と対立仮説は次の通り:
H0 : m = 120
H1 : m > 120
再録:標本平均の分布 母平均 m, 母分散 σ 2 の母集団から取り出した n 個の無作為標本の
平均値 X̄ の平均値の分布は
(
)
n
1∑
σ2
X̄ − m
√ ≈ N (0, 1)
X̄ =
Xk ≈ N m,
⇐⇒
n
n
σ/ n
k=1
演習問題 25 表が出る確率が 60% となるようなイカサマコインを作成した. 確認のため, 400
回投げたところ表が 235 回出た. コインは思惑通りできたといえるだろうか?
8.3. 2 種類の過誤
29
演習問題 26 人口 100 万のある都市において, ある計画についての賛否が五分五分かどうか
が問題になった. 無作為抽出された 1000 人に尋ねたところ, 545 人が賛成, 455 人が反対とい
う調査結果を得た. この計画についての賛否は五分五分といえるだろうか.
演習問題 27 N 候補の先週の支持率は 35% であった. 大規模な減税キャンペーンによって,
今週の支持率は 37 % となった. はたして, キャンペーンの効果はあったのだろうか. 調査対
象は 1000 人であった.
8.3
2 種類の過誤
帰無仮説 H0 をめぐって, 次の 4 つの場合がある.
採否 \ 真偽
H0 は真
H0 は偽
H0 を採択
正しい判断
第 2 種の誤り
H0 を棄却
第 1 種の誤り
正しい判断
文脈によっては, 第 1 種の誤りを「生産者危険」, 第 2 種の誤りを「消費者危険」という.
α: 第 1 種の誤り確率 = 有意水準
β: 第 2 種の誤り確率
θ
θ㪇
β
α
c㪈
c㪉
例 題 8.3 コインを 400 回投げたとき, 表が 215 回出た. コインは公正といえるだろうか? 第
2 種誤り確率について考察せよ.
演習問題 28 (発展) コインを 10 回投げて, コインが公正かどうかを判定する仮説検定を考
える. 表が出る確率を p とする. 帰無仮説と対立仮説は
1
1
H0 : p = ,
H1 : p ̸=
2
2
となる. コインを 10 回投げたうち表の出る回数を T とする. 棄却域として {T = 0, 1, 9, 10}
をとることにする. ここで, H0 が偽であるのに採択してしまう第 2 種誤り確率 β を p の関
数として観察せよ. ヒント:H0 を採択する確率は P (2 ≤ T ≤ 8) である.
31
第 9 章 母平均に関する仮説検定
9.1
検定の手順(再録)
1. 母集団の分布に関する帰無仮説 H0 と対立仮説 H1 を決める.
2. 適当な確率変数 T (検定統計量) を選び, 仮説 H0 の下で, この確率変数の分布を調べる.
3. 有意水準 0 < α < 1 と P (T ∈ W ) = α となる W ⊂ R (棄却域) を H1 を考慮して決
める (両側検定:両側 α-点, 片側検定:片側 α 点).
4. 標本から T の実現値 t を計算し, W に入るかどうかを見定める.
• t ∈ W のとき. 「検定統計量 T は棄却域に落ちるので, 有意水準 α で 有意であ
る. したがって, H0 を棄却し H1 を採択する」という.
• t ̸∈ W のとき. 「検定統計量 T は棄却域に落ちないので, 有意水準 α で 有意で
はない. したがって, H0 を採択する」という.
★ さまざまな情況における検定方法が開発されている. 基本は, 様々な検定推定量 (母平均
以外にも, 母分散, 母相関係数など色々ある) に対して, 理論的な分布 (正規分布, t-分布, χ2 分布, F -分布など) を用いて, 確率的に「稀なこと」が起こったかどうかを判断する.
9.2
母平均の検定 (母分散既知の場合)
母平均 m, 母分散 σ 2 の母集団から取り出した大きさ n の標本の標本平均について,
(
)
n
1∑
σ2
X̄ =
Xk ≈ N m,
n k=1
n
⇐⇒
X̄ − m
√ ≈ N (0, 1)
σ/ n
(近似の根拠は中心極限定理による. 正規母集団 N (m, σ 2 ) なら近似は不要.)
例 題 9.1 (片側検定) ある工場で使っている機械に新しい部品を採用するかどうか考えてい
る. 従来の部品の寿命は 120 時間であるが, 新しい部品の寿命はそれを上回るという. そこ
で, 16 個のサンプルで実際に寿命を調べたところ平均寿命は 121.2 時間であった. 部品の製
造工程の管理状況から, 新しい部品の寿命は標準偏差 2.4 時間の正規分布に従っているとし
てよい.
第9章
32
母平均に関する仮説検定
演習問題 29 ある調味料の製造ラインでは, 各製品の砂糖の含有量は m = 60 (g) になるよ
うに調整している. しかしながら, 原料の不均一や製造ラインの狂いなどから, m の値は 50
∼ 70 の間を変動するが, これまでの経験から標準偏差は常に一定で σ = 3 となっている (母
分散既知). ある時点で, 製品を 25 個抜き取って, 調査したところ, 砂糖の含有量の平均値は
61.43 であった. その時点で製造ラインは m = 60 を保持していると考えてよいか?
演習問題 30 女子学生 1000 名の学校からランダムに選ばれた 200 人の平均身長は 157.7 cm
であった. 全国の同じ年齢の女子の平均値は 158.6 cm, 標準偏差は 4.63 cm である. このク
ラスの平均身長は全国平均と異なると考えてよいか?[有意水準 1%の両側検定で「異なる」
と判定される]
演習問題 31 ある薬品は, 100 g 中不純物が 2g 以下ならば合格であるという. ある工場のロッ
トから, ランダムに 200 個の標本を選んで不純物量を測定したとき, 平均 2.2 g の不純物が
含まれていた. この工場の工程から, 不純物量の標準偏差は 1.5 g であることが経験的に知
られている. [有意水準 5%の片側検定で「不純物は規定以上とはいえない」]
9.3
二項母集団の母比率の検定
二項分布の正規分布近似 (これも中心極限定理といってよい)
B(n, p) ≈ N (np, np(1 − p))
np(1 − p): 分散
np: 平均値,
例 題 9.2 (両側検定) コインを 400 回投げたとき, 表が 175 回出た. このコインは公正と言
えるか, 仮説検定によって判定せよ.
演習問題 32 ある工場で作られる製品の不良率は 8% であるという. ある日の結果は, 良品
175 個, 不良品 25 個であった. 生産工程などに異常がないと言ってよいかどうかを仮説検定
で判断せよ.
演習問題 33 ある町で子供の遊び場をめぐって賛否が割れている. 無作為に選んだ 100 人の
意見は, 賛成 38 人, 反対 62 人であった. 町民の過半数が反対と判定してよいだろうか?[有
意水準 5%の両側検定すれば「反対」と判定される]
9.4
母平均の検定 (母分散未知の場合)
母平均 m, 母分散 σ 2 の母集団から取り出した n 個の標本を X1 , . . . , Xn とするとき,
1 ∑
U =
(Xi − X̄)2 ,
n − 1 i=1
n
2
前者を不偏分散, 後者を標本分散という.
1∑
S =
(Xi − X̄)2
n i=1
n
2
9.4. 母平均の検定 (母分散未知の場合)
33
定 理 9.1 不偏分散 U 2 は不偏性
E(U 2 ) = σ 2
を満たす.
標本分散は不偏性を満たさないので, 母分散の推定量としては不偏分散が優れている. た
だし, 標本数 n が大きくなれば, S 2 と U 2 の差はわずかである.
定 理 9.2 正規母集団 N (m, σ 2 ) から取り出した n 個の標本を X1 , . . . , Xn とする.
1∑
Xi (標本平均)
n i=1
n
X̄ =
このとき,
T =
1 ∑
(Xi − X̄)2 (不偏分散)
n − 1 i=1
n
U2 =
X̄ − m
√ ∼ tn−1
U/ n
自由度 (n − 1) の t-分布
正規母集団でなくとも, 標本数が大きいときは近似として成り立つ.
自由度 n の t-分布
1
)
(
√
n B n2 , 12
(
)− n+1
(
) n+1
2 − 2
2
Γ( n+1
)
t2
t
2
=√
1+
1+
n
n
n Γ( n2 )Γ( 12 )
㪇㪅㪋
n 㪔㩷㪊
n 㪔㩷㪌
㪇㪅㪊
n 㪔㩷
㪇㪅㪉
㪇㪅㪈
㪄㪋
㪄㪉
㪋
㪉
㪇
補足 (1) Γ はガンマ関数.
∫
Γ(x) =
∞
tx−1 e−t dt,
x > 0.
0
(2) B はベータ関数.
∫
1
tx−1 (1 − t)y−1 dt =
B(x, y) =
0
Γ(x)Γ(y)
,
Γ(x + y)
x > 0, y > 0.
(3) 自由度 n = ∞ の t-分布は標準正規分布 N (0, 1) に一致する.
(4) 実用上, n ≥ 30 で標準正規分布 N (0, 1) で代用.
第9章
34
t 分布表
n\α
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
∞
0.100
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.645
母平均に関する仮説検定
P (|T | ≥ tn (α)) = α
0.050
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
1.960
0.020
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.326
0.010
63.657
9.925
5.841
4.604
4.032
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.576
例 題 9.3 ある日に製造された大量の製品から 10 個をサンプリングして重量 (kg) を測定し
た結果,
53.2 61.5 48.1 51.3 55.7 47.2 54.5 57.9 53.8 49.2
となった. 規定値は 50kg であるが, この日に生産した製品の平均重量は規定に沿っているか?
問 22 正味 500g と書いてある製品を 120 個選んで調べたところ標本平均 498g, 不偏分散 102
g であった. この製品は, 明記されたとおりの内容になっているか? 有意水準 5%で検定せよ.
有意水準 1%ではどうか.
演習問題 34 ある英語の資格試験の全国平均は 66 点であった. A 塾から 10 名が受験した. 結
果は
78 72 65 86 58 64 76 88 74 59
であり, その平均点 72 点が 66 点を大きく上回ると A 塾は主張している. 検定によって A 塾
の主張を確認せよ. [有意水準 5%の片側検定で「上回っているとは言えない」]
35
第 10 章 カイ 2 乗検定
Karl Pearson (1857–1936)
10.1
カイ 2 乗分布
密度関数が




1
x
n
( n ) x 2 −1 e− 2 , x > 0,
n/2
fn (x) = 2 Γ 2


0,
x ≤ 0,
で与えられる確率分布を自由度 n のカイ 2 乗分布 (χ2 -分布) という. (χ2 は一つの文字とし
て扱う.) 自由度を明記して, χ2n と書くこともある. ここで, Γ(t) はガンマ関数.
n= 㩷㪇㪅㪌
㩷㪇㪅㪋
n= 㩷㪇㪅㪊
n= n= 㩷㪇㪅㪉
n= 㩷㪇㪅㪈
χ2 -分布に従う確率変数 (1) X1 , X2 , . . . , Xn が独立, 同分布の確率変数で, 標準正規分布
N (0, 1) に従うとき,
n
∑
2
Xi2
χn =
i=1
は自由度 n の χ2 -分布に従う.
(2) X1 , X2 , . . . , Xn が独立, 同分布の確率変数で, 正規分布 N (m, σ 2 ) に従うものとする. こ
のとき, 標本分散を計算する途中に現れる
n
n
1 ∑
1∑
2
2
χn−1 = 2
(Xi − X̄) ,
X̄ =
Xi (標本平均)
σ i=1
n i=1
は自由度 n − 1 のカイ 2 乗分布に従う.
第 10 章 カイ 2 乗検定
36
10.2
適合度検定
観測された頻度分布が理論分布と同じかどうかを検定する.
母集団の属性が A1 , A2 , . . . , Ak の k 種類に分けられている. n 個の標本から, それぞれに
属するものが X1 , X2 , . . . , Xk 個得られたとする.
属性
理論分布
観測度数
A1
p1
X1
A2
p2
X2
···
···
···
合計
1
n
Ak
pk
Xk
観測値から, 各属性の現れる理論分布 p1 , p2 , . . . , pk が妥当かどうかを検定する.
定 理 10.1 mi = npi とおくとき,
χ2k−1
=
k
∑
(Xi − mi )2
mi
i=1
は, m1 , . . . , mk が大きいとき (mi = npi ≥ 5), 自由度 k − 1 のカイ 2 乗分布に近似的に従う.
例 題 10.1 次の表は, サイコロを 120 回投げて出た目を記録したものである. このサイコロ
は公正と言えるだろうか?
目
回数
1
24
2
18
3
16
4
22
5
23
6
17
合計
120
問 23 次の表は, あるクラブの部員の血液型を調べた結果である. 日本人の血液型の分布は
4 : 3 : 2 : 1 であると言われている. このクラブの部員の構成は, これに従っていると言える
だろうか?
血液型
人数
A
47
O
23
B
21
AB
9
合計
100
演習問題 35 人口 150 万人のある都市で, 子供を 5 人持つ 3868 家庭を無作為抽出して, 子供
5 人の性別を調べた. この結果から, この都市で, 子供を 5 人持つ家庭では男女の性比が 1:1
であると言えるだろうか? [二項分布と比較する]
男:女
家庭数
0:5
92
1:4
603
2:3
1137
3:2
1254
4:1
657
5:0
125
合計
3868
演習問題 36 ある映画で観客の人数を調べたら, 男 45 人, 女 55 人であった. このことからこ
の映画は女性に人気が高いと言えるだろうか? (1) 二項母集団の母比率の検定 (2) 適合度検
定, の 2 つの方法で確かめよ.
10.3. 独立性の検定
10.3
37
独立性の検定
定 理 10.2 2 種類の属性 A = {A1 , . . . , Ar }, B = {B1 , . . . , Bs } が独立であるとき,
)2
(
Xij
Xi· X·j
−
r ∑
s
∑
n
n n
2
χ =n
Xi· X·j
i=1 j=1
n n
は, n が大きいとき (Xij ≥ 5), 自由度 (r − 1)(s − 1) のカイ 2 乗分布に近似的に従う.
B1
X11
X21
A1
A2
..
.
Ar
合計
Xr1
X·1
B2
X12
X22
···
···
···
Bs
X1s
X2s
Xr2
X·2
···
···
···
合計
X1·
X2·
..
.
Xrs
X·s
Xr·
n
例 題 10.2 予防接種と発病の関係について次の結果を得た. 予防接種の効果は認められるか?
予防接種有
予防接種無
合計
発病有
21
28
49
発病無
102
49
151
合計
123
77
200
演習問題 37 あるグループで 1 日のテレビ視聴時間を調べて次の結果を得た. 年齢と時間数
に関係があるだろうか?
2 時間以内
2∼3 時間
3 時間以上
合計
24 歳以下
37
24
29
90
25∼35 歳
155
59
56
270
36 歳以上
78
25
77
180
合計
270
108
162
540
定期試験
1. 水曜日のクラス= 7 月 18 日
木曜日のクラス= 7 月 19 日
2. 教科書・参考書・ノート・計算機等の持ち込み不可. 鉛筆と消しゴムだけで解答する.
3. 期末試験は 1 回だけ実施し, 欠席者・成績不良者に対する再試験はしない.
4. 公欠が予定され追試験を希望するものは, 追試験願を手渡しで提出せよ (様式任意, 学籍番号・
氏名・欠席理由・提出年月日を記入のこと) 提出のない場合は, 追試験を行わない.
提出締切:水曜日のクラス= 7 月 11 日
木曜日のクラス= 7 月 12 日
5. 定期試験を病欠した場合は, 正式の手続きに従って取り扱う.
6. 配布プリントの「演習問題」や教科書の「問題」をよく研究しておいてください. なお, 過去問
等はウェッブページに掲載している.
第 10 章 カイ 2 乗検定
38
カイ・スクエア分布: P (χ2n ≥ χ2n (α)) = α
α
χn㪉 㩿㩷㩷㩷㪀
α
㪇
n\α
0.995
0.99
0.975
0.95
0.05
0.025
0.01
0.005
1 0.04 393 0.03 157 0.03 982 0.02 393
2
0.010
0.020
0.051
0.103
3
0.072
0.115
0.216
0.352
4
0.207
0.297
0.484
0.711
5
0.412
0.554
0.831
1.145
6
0.676
0.872
1.237
1.635
7
0.989
1.239
1.690
2.167
8
1.344
1.646
2.180
2.733
9
1.735
2.088
2.700
3.325
10
2.156
2.558
3.247
3.940
3.841
5.991
7.815
9.488
11.070
12.592
14.067
15.507
16.919
18.307
5.024
7.378
9.348
11.143
12.833
14.449
16.013
17.535
19.023
20.483
6.635
9.210
11.345
13.277
15.086
16.812
18.475
20.090
21.666
23.209
7.879
10.597
12.838
14.860
16.750
18.548
20.278
21.955
23.589
25.188
11
12
13
14
15
16
17
18
19
20
2.603
3.074
3.565
4.075
4.601
5.142
5.697
6.265
6.844
7.434
3.053
3.571
4.107
4.660
5.229
5.812
6.408
7.015
7.633
8.260
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
9.591
4.575
5.226
5.892
6.571
7.261
7.962
8.672
9.390
10.117
10.851
19.675
21.026
22.362
23.685
24.996
26.296
27.587
28.869
30.144
31.410
21.920
23.337
24.736
26.119
27.488
28.845
30.191
31.526
32.852
34.170
24.725
26.217
27.688
29.141
30.578
32.000
33.409
34.805
36.191
37.566
26.757
28.300
29.819
31.319
32.801
34.267
35.718
37.156
38.582
39.997
21
22
23
24
25
26
27
28
29
30
8.034
8.643
9.260
9.886
10.520
11.160
11.808
12.461
13.121
13.787
8.897
9.542
10.196
10.856
11.524
12.198
12.879
13.565
14.256
14.953
10.283
10.982
11.689
12.401
13.120
13.844
14.573
15.308
16.047
16.791
11.591
12.338
13.091
13.848
14.611
15.379
16.151
16.928
17.708
18.493
32.671
33.924
35.172
36.415
37.652
38.885
40.113
41.337
42.557
43.773
35.479
36.781
38.076
39.364
40.646
41.923
43.195
44.461
45.722
46.979
38.932
40.289
41.638
42.980
44.314
45.642
46.963
48.278
49.588
50.892
41.401
42.796
44.181
45.559
46.928
48.290
49.645
50.993
52.336
53.672
40
50
60
70
80
90
100
20.707
27.991
35.534
43.275
51.172
59.196
67.328
22.164
29.707
37.485
45.442
53.540
61.754
70.065
24.433
32.357
40.482
48.758
57.153
65.647
74.222
26.509 55.758 59.342 63.691
34.764 67.505 71.420 76.154
43.188 79.082 83.298 88.379
51.739 90.531 95.023 100.425
60.391 101.879 106.629 112.329
69.126 113.145 118.136 124.116
77.929 124.342 129.561 135.807
66.766
79.490
91.952
104.215
116.321
128.299
140.169
値は小数第 4 位以下 (n = 1 では表示桁未満) を四捨五入してある.
39
第 11 章 回帰分析
散布図
11.1
(x, y): x = 身長, y = 体重
㻝㻟㻜
㻝㻞㻜
㻝㻝㻜
㻝㻜㻜
㻥㻜
㻤㻜
㻣㻜
㻢㻜
㻡㻜
㻠㻜
㻟㻜
㻝㻠㻜
㻝㻡㻜
㻝㻢㻜
㻝㻣㻜
㻝㻤㻜
㻝㻥㻜
平均値と分散
11.2
平均値
1∑
x̄ =
xi ,
n i=1
n
分散
1∑
=
(xi − x̄)2 ,
n i=1
1∑
ȳ =
yi ,
n i=1
n
n
σx2
1∑
=
(yi − ȳ)2 ,
n i=1
n
σy2
注意 確率変数 (X, Y ) の言葉では,
m = E[X],
σ 2 = V[X] = E[(X − m)2 ] = E[X 2 ] − E[X]2
例 題 11.1 (1) 左図
n = 205 x̄ = 157.9 ȳ = 50.9 σx2 = 27.83 = 5.282
σy2 = 34.43 = 5.872
(2) 右図
n = 917 x̄ = 171.6 ȳ = 63.8 σx2 = 28.94 = 5.382
σy2 = 75.69 = 8.702
㻞㻜㻜
第 11 章 回帰分析
40
11.3
回帰分析
2 つの変数 x, y の関係性を議論する必要性は様々な場面で起こるだろう. 身長と体重, 血
圧と BMI(肥満度), 握力と背筋力のように, 相互依存の関係はあるが, 数学の関数のように,
一方から他方が一意に決まるということはないという状況に関心がある.
一方の変数 (説明変数) x から他方の変数 (目的関数) y を表わす合理的な関数 y = f (x) を
求めることが「回帰分析」の目的である. この関数を「回帰モデル」と呼び, 1 次関数になっ
ているとき, 「線形回帰モデル」という.
既存のデータから回帰モデルを作ることができれば, 制御や予測に応用することができる.
たとえば, 過去の売上高と宣伝費のデータから, 目標とする売上高に対して宣伝費を決定す
ることなどが考えられる.
11.4
共分散と相関係数
2 次元データ (xi , yi ) (i = 1, 2, . . . , n) から x, y の線形関係を調べるための基本的な統計量
として
定 義 11.1 共分散
1∑
1∑
(xi − x̄)(yi − ȳ) =
xi yi − x̄ȳ
=
n i=1
n i=1
n
σxy
n
相関係数
rxy =
注意 標準化した変量
x̃i =
xi − x̄
,
σx
σxy
σx σy
ỹi =
yi − ȳ
σy
の共分散は x, y の相関係数になる. つまり,
σx̃ỹ = rxy = rx̃ỹ
定 理 11.2 相関係数について −1 ≤ rxy ≤ 1.
rxy > 0 のとき正の相関, rxy < 0 のとき負の相関があるという. 概ね, |rxy | > 0.8 のときは
強い相関があり, |rxy | < 0.2 のときは無相関とみなす.
例 題 11.2 (1) 左図: σxy = 19.96, rxy = 0.64
(2) 右図: σxy = 19.97, rxy = 0.43
11.5. 最小二乗法
41
㪎
㪍
㪌
㪌
㪋
㪋
㪊
㪊
㪉
㪉
㪈
㪈
㪇
㪇
㪄㪈
㪄㪈
㪄㪉
㪄㪉
㪄㪊
㪄㪊
㪄㪋
㪄㪊
㪄㪉
㪄㪈
㪇
㪈
㪉
㪋
㪊
㪄㪋
㪄㪋
11.5
㪄㪊
㪄㪈
㪄㪉
㪇
㪈
㪉
㪊
最小二乗法
(x1 , y1 ), . . . , (xn , yn ) の観測値を説明する線形回帰モデルとして,
y = ax + b
という形を期待する. yi = axi + b + ϵi として, 誤差の平方和
Q=
n
∑
ϵ2i
i=1
n
∑
=
(yi − axi − b)2
i=1
を最小にするように a, b を定める (最小二乗法). 和を展開して計算すると,
Q=
n
∑
(yi2 + a2 x2i + b2 − 2axi yi − 2byi + 2abxi )
i=1
=
∑
yi2 + a2
∑
x2i + b2 n − 2a
∑
xi yi − 2b
∑
yi + 2ab
∑
Q の最小値を求めるために,
∑
∑
∑
∂Q
= 2a
x2i − 2
xi yi + 2b
xi = 0,
∂a
∑
∑
∂Q
= 2bn − 2
yi + 2a
xi = 0
∂b
を解くと求めるべき a, b が出る:
σxy
a= 2 ,
b = ȳ − ax̄
σx
例 題 11.3 (1) 左図: y = 0.72x − 62.79
(2) 右図: y = 0.69x − 54.60
xi .
㪋