講義にて配布した資料の抜粋・縮小版です 平成22年度 統計工学 平成22年度 統計工学 構造模型によるデータ構造の理解 • 一元配置データ 平成22年度 統計工学 講義資料(11) A1 A2 x11 x21 x12 x22 Aa xa1 xa 2 一元配置データが無作為に抽出・収集された場合 全部で 1つのデータを取るたびに因子Aの水準を設定し直す x1r x2 r データ構造 X ij i + ij i 1, , a , j 1, , r xij ar 回のデータ収集の無作為化 – – X ij i + j xar A1の j 番目の値における誤差と A2の j 番目の誤差には 何ら共通性がないことに注意! 要因効果抽出のための分解 ~統計的推論:分散分析Ⅱ~ 1 2 a a 構造模型 X ij i ij i i 制約: 1 2 a 0 i についてはこの制約により a 1 個のデータで決定される ことから,自由度が a 1 となる • 「Aの水準間で平均値がすべて等しい」という命題は・・・ a i 1 平成22年度 統計工学 平成22年度 統計工学 二元配置分散分析の考え方 【二元配置データ 二元配置データ】 】 • 因子:特性値に影響を及ぼす要因 • – 要因1:因子A(水準数 a) – 要因2:因子B(水準数 b) A1 A 繰り返し数:r xijk ・・・水準 AiBj における k 番目の観測値 0 (C) Sadami SUZUKI B1 x111 x11r B Bb x1b1 x1br (繰り返しのある) 特性値:収集するデータ(観測値) 2 (C) Sadami SUZUKI 二元配置分散分析 ( Two-way ANOVA ) • i Aa xa11 xa1r バラツキの分解 • (全体の平均からのバラツキ)= (因子Aのバラツキ)+(因子Bのバラツキ) +(因子Aと因子Bの組合せによるバラツキ) +(残りのバラツキ) xab1 xabr 因子Aのバラツキ ・・・因子Aの水準間の違い;因子Aの主効果 因子Bのバラツキ ・・・因子Bの水準間の違い;因子Bの主効果 因子の組合せによるバラツキ ・・・因子Aと因子Bの組合せによる違い;交互作用 ・・・ある水準の組み合わせ(AiBj)の中で 残りのバラツキ 個々のデータがどれほどバラついているか – 残差,誤差,個人差 (C) Sadami SUZUKI (C) Sadami SUZUKI 平成22年度 統計工学 平成22年度 統計工学 二元配置データにおけるバラツキの分解 • 二元配置データにおけるバラツキの分解 • 2因子を組合わせて考えると・・・ 繰り返しのある二元配置データ B1 二因子を組み合せ因子とした場合 Bb x11r A1 B1 x111 x111 x1b1 A1 B2 x121 x12 r A1 Aa Bb xab1 xabr x11r x1br (総平方和)= (因子Aの主効果平方和)+(因子Bの主効果平方和) +(因子Aと因子Bの交互作用平方和) +(残差平方和) a b r S T xijk x 2 i 1 j 1 k 1 a b a b a b r br b xi x ar x j x r xij xi x j x xijk xij i 1 2 j 1 2 2 i 1 j 1 2 i 1 j 1 k 1 Se xa11 xab1 Aa 平方和分解 一元配置データと同様の構造に 帰着させることが可能 S T S A S B S A B S e ST S A B S AB SB xa1r xabr SA (C) Sadami SUZUKI (C) Sadami SUZUKI 1 講義にて配布した資料の抜粋・縮小版です 平成22年度 統計工学 平成22年度 統計工学 二元配置分散分析(Two-way ANOVA) 二元配置分散分析(Two-way ANOVA) Step3:検定に用いる統計量の選択とその分布に関する検討 • Step3:検定に用いる統計量の選択とその分布に関する検討 SA Se 考察の対象:残差平方和と比較した各平方和の大きさ・・・ SB Se 【因子Aの主効果】 S A B Se 【因子Bの主効果】 • – FA T abr b 1 – 総平方和の自由度:総サンプル数-1・・・ 総平方和の自由度 – 因子Aの主効果平方和の自由度:(因子A水準数)-1・・・ 因子Aの主効果平方和の自由度 – 因子Bの主効果平方和の自由度:(因子B水準数)-1・・・ B 因子Bの主効果平方和の自由度 – 因子Aと因子Bの交互作用平方和の自由度・・・ 因子Aと因子Bの交互作用平方和の自由度 – 残差平方和の自由度・・・ 残差平方和の自由度 – A a 1 FB A B A B ( a 1)(b 1) – F A B 2 全データ数 i i 平成22年度 統計工学 平成22年度 統計工学 A での値の和 A でのデータ数 i B での値の和 B でのデータ数 a i 1 b CT r j 1 k 1 a • ijk 2 r x i 1 k 1 ar ijk CT 全部で a x1br x11r b i 1 j 1 ij α に着目して 複数の因子を取り上げた際の要因効果についての整理 【 (例)2つの2水準因子の場合 】 b 【 行平均 】 j 1 b 2 b A1 11 12 A2 21 22 j i 1 ij 単一効果 a ・・・他の因子をある水準に固定したときの効果 – 固定した他の因子の条件に依存した効果 • 因子AのB1での単一効果 21 - 11 ij i j ij • 因子AのB2での単一効果 22 - 12 a b 0, j 0, j 1 B1 B2 a 【 列平均 】 ij 2つ以上の要因を同時に取り上げた場合・・・ それぞれの要因効果は単一効果という形のみでは評価不能 i 1, , a, j 1, , b, k 1,, r それぞれの主効果および交互作用なしという命題は・・・ i となる確率 FA B V A B / Ve 平成22年度 統計工学 x12 r A1 B2 x121 a e ab ( r 1) FB V B / Ve 平成22年度 統計工学 X ijk i j ij ijk i 1 T abr 1 A B ( a 1)(b 1) F比(F値) FA V A / Ve (C) Sadami SUZUKI 構造模型 • ST B b 1 平均平方(不偏分散) VA S A / A VB S B / B V A B S A B / A B Ve S e / e (C) Sadami SUZUKI • i ab xabr xa1r A1 B1 x111 x11r 自由度 abr 回のデータ収集の無作為化 ij ij i j A a 1 α i i j j xa11 xab1 SA SB S A B Se 有意水準 で主効果・交互作用の検定を行う X ijk ij + ijk 【 総平均 】 平方和 A B A B e F* Fnm ( ) データ構造 Bb 要因 T 二元配置データが無作為に抽出・収集された場合 二元配置データ xabr Aa Bb xab1 分散分析表の活用 2 br j 1 CT • S e S T S AB – Aa CT ijk S A B S AB S A S B i 1 j 1 k 1 構造模型によるデータ構造の理解 j r k 1 x j r xijk 2 CT CT 2 r i SB b i 1 j 1 b 自由度 (a-1)(b1)(b-1), 1), ab ab((r-1) の F 分布に従う (C) Sadami SUZUKI j 2 x1b1 x111 S A B / A B S e / e (C) Sadami SUZUKI x CT 2 SA S T 個々の値 CT A1 j 2 2 a A B での値の和 A B でのデータ数 2 S AB 2.総平方和の計算 B1 自由度 b-1, ab ab((r-1) の F 分布に従う Step4:検定量を用いて仮説が正しいか否かを判定する 3.各平方和の計算 個々の値 b S B / B S e / e 二元配置分散分析(Two-way ANOVA) 1.修正項の計算 a 自由度 a-1, ab ab((r-1) の F 分布に従う 因子Aと因子Bの交互作用 e T A B A B ab ( r 1) a b r xijk i 1 j 1 k 1 abr S A / A S e / e 因子Bの主効果 b 1 実際に各平方和を計算するときは,次のようにすると便利である CT 因子Aの主効果 【因子Aと因子Bの 交互作用】 平方和計算の実際 • 検定量:各主効果,交互作用の平方和と残差平方和をそれぞれの自由度で割った値(平均平方)の比(F比) 2 i 1 j 1 ij 2 0 (C) Sadami SUZUKI 主効果 ・・・単一効果の他の因子の条件(水準)間での平均 • 因子Aの主効果 交互作用 21 11 22 12 21 22 11 12 2 2 ・・・単一効果の他の因子の条件(水準)間での違い • 因子AとBの交互作用 21 11 22 12 21 12 11 22 (C) Sadami SUZUKI 2
© Copyright 2024 Paperzz