計測工学II 【第13回】Excelによる有意差の検定 今日の内容 • 【第13回】Excelによる有意差の検定 • 「危険率や統計検定」を学習します。 有意差とは? • 計測して、データを取りました。 • データ処理して、特性を調べました。 • それで、何がわかるの? • ある治療法だと、病気の治癒率が高い! • なぜ、そう言い切ることができるの? • 有意差があることを示す。 • 意味の有る差 (Significant Difference) • 意味のない差があるの? • 「偶然」差が出てしまった。 • 偶然何かが起きる確率を計算して、その確率が「十分小さい」ことが示 せれば、「意味があった」と言える。 帰無仮説 • 帰無仮説って何? • 無に帰る仮説・・・ (有意差と同様、読んで字の如く) • 「この治療法が役に立つなんて、間違いさ!」という仮説 • 「どちらも差がない」(同じ母集団に属する)という仮説 • 通常、証明したい事実を否定する仮説のことを言います。 • 実際のデータを処理して、普通の治療法と、新しい治療法を比べる。 • 比べて、「両方の結果に違いが出たのは偶然である」確率を計算する。 • その確率が 5% だったしたらと、「5%の危険率で、帰無仮説が棄却さ れた」と言う。 危険率 • 危険率とは? • うっかり間違えて、帰無仮説を棄却してしまう確率。 • 偶然いい結果がでる確率が 5% はあるのだから、「この 治療法は効果がある」と言ってしまっても、 5% は「偶然 の結果」で、間違っているかも知れない。 • 本当は帰無仮説が正しかったのだけど、偶然違いが出てし まう確率 • どの程度「意味があると言えるか」ということで、有意水準 ともいいます。 対立仮説 • 帰無仮説に対して、「これから証明したいこと」を対立仮説と言 います。 • 仮説のことを英語でHypothesis (ハイポセシス)と言います。 • 帰無仮説を通常H0で表し、 • 対立仮説を通常H1で表します。 「偶然」をどうやって証明する? • 平均値から極端に外れたデータは、「発生確率」が小さい。 • この値なら、人口1万人に一人くらい、この値だと、人口1億人に一人、と いう性質がわかる。 • 身長2m10cmの人が、電車に乗り合わせる確率は?(かなり小さい) • それが、もし、乗り換えた電車でも3回連続したら、単なる偶然と言える か? • 「一つの集団」の統計的な性質は、正規分布する、ということ を前提にする。 • 異なる二つの集団の「統計的な性質」は、異なる。 • 日本人の集団で、60歳のグループの身長と、20歳のグループの身長は、 異なる。 母集団と標本 • 例:「全日本人の、20代男子の集団」を「母集団」とする。 このクラスの男子を、「標本」とする。 母集団と標本で、身長を比較する。 • 標本数が大きければ、その統計的な性質は、母集団の統計的な性 質に近づく。 • 救急救命の学生と、臨床工学の学生で、身長の平均を比較する。 • どちらも、同じ母集団のはず。 • 「標本」が偏っていると、母集団と統計的な性質が異なることがある。 • 例:バレーボール部に所属する人と、母集団とを比較すると、平均値が異なる場 合が多い。 • 測定データAと、条件を変えて測定したデータBを比較し、それぞれ の「標本」が、「同じ母集団に属する」確率を求める。 • → これが「危険率」 • 元々同じ母集団に属するのに、偶然差があるという結果がでる確率。 生物学的・医学的統計の例 • サイトの引用です。 • 下図のデータは、40歳代男性の透析患者9名、同年代の病院 職員の健常者7名のIgG値(mg/100ml)を測定した結果です。 IgGとは免疫グロブリンタンパクの一種です。(出典;「新版 医 学への統計学」朝倉書店) • 分析の目的 • 透析患者のIgG値が健常者に比べて高いか どうかを調べます。有意水準1%で片側検定を 行います。 • 帰無仮説 H0:透析患者と健常者の母平均は等しい • 対立仮説 H1:透析患者の母平均は健常者の 母平均よりも大きい http://software.ssri.co.jp/statweb2/sample/example_3.html 統計的処理(前期、第4回) • 平均値 • データの総和をNで割る • 計算が容易 • 正規分布の場合の中心の値 を推定 • 標準偏差 • 正規分布を仮定した場合、 データが平均値の周囲にどの 程度分散しているかを示す値。 • X±σに、68.26%が集中 • X±2σに、95.44%が集中 • X±3σに、99.74%が集中 標本群の比較 • 「統計的な性質」が同じかどうかは、「平均」と「標準偏差」で比 較する。 • 標準偏差が大きい → 裾野が広がっているので、平均から値が離れ ているデータが多くある可能性が高い。 • 標本群の平均が離れていても、同じ母集団に属する可能性が高くなる。 • 母集団が同じであるなら、平均値が近いはず。 • 平均値と、標準偏差を用いて、 複数の「標本群」が同じ母集団に 属するかを検証する。 このグラフの見方、 わかりますよね!? 分布の種類 • 正規分布 • 最も一般的な分布で、生物・医学的データなどはほとんどこれだけで処理で きる。(と思う・・・) • 二項分布 • これもよく用いる。「コインの表が出た」「裏が出た」など、二律背反の場合の 統計的な分布 • ポアソン分布 • 二律背反でも、発生確率が小さく、母集団も大きい場合の確率を処理する 分布。(アルビノ[色素がない個体]が発生する確率、など。) • データを処理するときは、どの分布に従うデータなのかは、性質をよ く考える必要がある。(パラメトリックな検定) • ただ、スケーラブルなデータでは、ほとんど正規分布を考えます。 様々な検定方法 • t検定 • 二つのグループの平均値の違いに、有意な差があるかどうかの検定 • F検定 • 二つのグループの分散の違いに、有意な差があるかどうかの検定 • χ2検定 (カイ2乗検定) • ピアソンのカイ二乗検定:頻度分布の比較に用いる。 • 事象は互いに排他的でなければならない(例えば「さいころの目」、「あ る人が男か女か」など)。 • コンピュータの乱数が本当に「ランダム」か、頻度分布に置き換えて検定 を行う場合などに使う。 参考ページ:Wikipedia データの性質で方法が異なる • 「度数」と「連続量」とで、処理方法を変えます。 • 度数 → 度数分布:ヒストグラムで表す。 • サイコロの目が出た回数。 • Countable な(数えることができる)データ • 度数分布を処理すると、「Aである確率」と「Aでない確率」(二律背反)に分 けられるため、二項分布に従う。 • 連続量 • 身長や体重など • Scalableな(計測で数値を出せる)データ • 今回は、これだけを扱う • 順序尺度 (1位、2位という序列が与えられたデータ) • AKB48の人気順位(ランキング)の統計的分析! • とにかく、これらによって「処理方法が違う」ということをしっかり思い 出して、後は統計の専門書へ! 自由度 • 正規分布で検定を行う際に、「自由度」という概念が出てきま す。(degree of freedom) • 「自由」って何? • → 一つ一つが型にはめられていなくて、独立の(外部から制御されて いない)値を持つことができている。 • その度合い? → 簡単には、データの個数(それぞれが独立変数) • 全変数の数から、それら相互間に成り立つ関係式(束縛条件、拘束条 件)の数を引いたものである。 [引用元:Wikipedia] • 近似的には「データ数」ですが、「データ数=自由度」ではあり ません。さらに、個々のデータ間の条件式があるため、例えば Welchの方法では「整数値」ではなく、実数値を持ちます。 不偏分散 n 1 2 2 s = (x − x) • 例えば、不偏分散 ∑ i n −1 i=1 • については、 n x= 1 xi ∑ n i=1 • という関係式(ここで は母集団平均 µ の推定量である)があ るから、自由度は1少ないn - 1となる。 • このため、標準偏差ではなく、不偏分散が使われることが多い。 • 標準偏差だと「標本分散」が「母集団の分散」よりも小さくなる ことが多いが、「標本の不偏分散」の期待値は、母集団の分 散に等しくなる。 引用元:Wikipedia Excelと不偏分散 • 標準偏差 σ は、分散の平方根で、以下の式で計算されます。 1 n 2 σ= (x − x) ∑ i n i=1 • この式は、「母集団」の標準偏差の計算に用いて、EXCELで は = STDEV.P() 関数になります。標本の場合には、不偏 分散の式を用いるので、標準偏差は n 1 2 s= (x − x) ∑ i n −1 i=1 の式になり、EXCELの関数は = STDEV.S () になります。 両側検定と片側検定 調べたい現象で、平均が大きくなるか小さくなるかわからない 場合には、平均が大きい方と小さい方の「両側」を調べます。 • 例:ある薬品を使うと、血圧が上がるか下がるか、よくわかっていない 場合、「正常な平均値」からの上と下の両方を調べます • 「血圧が下がる」ことがわかっている際に、「こんな使い方で 効果が出るか」を調べる場合には、「片側」を調べます。 画像引用元: http://homepage2.nifty.com/nandemoarchive/toukei_hosoku/ryougawa_katagawa.htm 棄却域って何? • 前のページのスライドで、グラフの端の方を「棄却域」と書きま した。 • 帰無仮説が「仮説として正しくない」と判断することを「仮説を 棄却する」と言います。帰無仮説が棄却されるということは、 「対立仮説が正しい」ということなので、「証明したい内容が証 明された」という意味になります。 • 分布のグラフで、面積が小さいということは、確率的に起こり にくいことを意味し、「この薬に効果があったなんて、単なる偶 然さ」という、その「偶然の起きる確率」がものすごく小さいこと を示していることになります。 今回は、計算しないの? • 前回まで、Excelの「お任せ」機能を使わずに、Σを計算して相 関係数などを求めました。 • 今回は、有意水準の推定で、ガンマ関数やベータ関数という 特殊関数を使いますが、有意水準ごとに、計算量の多い積分 計算を行う必要があります。 • このため、一般には計算済みの数表を使い数表を読んで、検 定値を判断します。 • できれば、「t値」などを計算し、その「t値」での「有意水準が何%か」わか ればいいのですが、ガンマ関数の積分の逆関数がとにかくやっかいな ので、とにかく従来は数表を使いました。 今回は、計算しないの?(Part 2) • 級数展開、積分など計算式を設定するのは内容的にも時間 的にも困難なので、今回はこの部分はExcelの関数を使いま す。 • ガンマ関数やベータ関数は数学科などの皆さんにお任せしましょう。 • そのものズバリの検定用関数を使います。 • 重要な概念や用語が大量に出て来るので、とにかく言葉の意 味をしっかり覚え、「こういう時は処理法を変える」ということだ けは覚えておいて下さい。 • そして、実際にデータを処理する時に、統計の本などで確認して下さい。 t検定の種類 • t検定では、平均の違いを比べる。 • ですが、そのt検定だけでも「どんな時にこんな計算式を使う」 というのが分かれてきます。 • paired-t(データに対応がある時のt検定) • 「使用前」 → 「使用後」みたいなデータ • 対応はないが、分散が等しい時 • 対応がなく、分散も等しくない場合。 • Excelの =TTEST()関数で、引数を 変えます。 図引用元:http://www.geisya.or.jp/~mwm48961/statistics/bunsan1.htm 検定の行い方(従来の方法) • データの種類(度数、量、順序尺度)などによって、検定方法 を選ぶ。 • その検定による「検定値」を計算する。 • 例: t値、 F値、 χ2値 など • 統計分布関数から、「ある有意水準」で、その「自由度」でのt 値、F値、χ2値などを数表から調べる。 • その「有意水準」での検定値よりも、調べる検定値が大きけれ ば、その有意水準では、同じ母集団に属さない(有意差があ る)と判断する。(t値、F値、χ2値の場合) Excelを使っての検定 • 数表を調べる、という部分がExcelの関数になり、計算したF値 やt値をとる場合の「確率」が計算できるようになりました。 • この場合には、計算で求めた「確率」が、調べたい有意水準よ りも大きければ、計測データにおいて帰無仮説が起きることは 「確率的にも大きい」、つまり、統計的に違いがない、つまり、 「治療法が有効」などとは言えない、などという結果になります。 • 逆に言えば、論文として成り立ちやすいのは、「偶然の確率」 が有意水準よりも小さいから、帰無仮説は棄却できる、つまり、 「この治療法の有効性が統計的に証明された」という流れで論 証します。 F検定の両側、片側 • t検定の場合には、平均が大きくなるか、小さくなるか(片側) がわかっているか、平均が異なるか、(両側)で、検定の読み 方に「両側」「片側」があります。 • F検定の場合、もちろん分散が大きいか、小さいか(片側)、 違っているか、という差がありますが、F値を計算する際に、分 散が大きい方を分母とする、という方法をとりますので、必ず 「片側」になります。 • F検定で、分散が大きいか、小さいかを問題にする場合には、両側の場 合の式を参考にして下さい。 • 別途、統計の資料やサイトなどを参照して式を組み直して下さい。 統計計算の実際 下図のデータは、AクラスとBクラス(全員)の定期試験の結果で す。(架空)この二つのクラスに、実力の差があると言えるか、 5%の有意水準で検証して下さい。 • 分析の目的 • 二つのクラスのテストの結果が 統計的に差があると言えるか 検証する。 • 帰無仮説 H0:両クラスの平均は等しい (違いは、偶然の範囲内である。) • 対立仮説 H1:両クラスの平均は統計的に 異なると言える。 平均と標準偏差を求める • 平均は、=average(範囲) で入力できます。 • 分散は・・・ • 今回のデータは、「Aクラス」と「Bクラス」の全体ですので、母集団です。 母集団の分散の場合には、 標準偏差σ=STDEV.P(範囲)を使います。 • もし、検証がスライドの 9 ページのように、「全ての透析患者」と「全ての健 常者」を母集団とし、データを取ったのがその一部である(ほとんどの生 物・医学的な統計は、こちら)である場合には、不偏分散の標準偏差 s=STDEV.S()を使います。 • この時は、母集団ではなく、標本集団という言い方をします。 分散、データ数、自由度 • 分散には、標準偏差の二乗 =count(範囲) 関数 • 自由度には、データ数−1を入力します。 • Aクラスのデータの場合 • データ数には、 • C14 =AVERAGE(C4:C12) • C15 =STDEV.P(C4:C12) • C16 =C15*C15 • C17 =COUNT(C4:C12) • C18 =C17-1 • という式を入力する。 • C列に数式は、 オートフィルで D列にコピーできます。 F値 • F値は、二つの分散値のうち、大きい方を分子とする比を計算 します。(これにより、F値は片側検定になります。) • C19の分散比(F値)では、 =IF(C16>D16,C16/D16,D16/C16) • という式を使ってみました。 • C20には、有意水準の値を入力しました。 F検定 • F検定の関数は、F.TEST()です。 • 古いバージョンのEXCELでは、FTEST()として下さい。 • FTESTの戻り値は、両側検定の確率です。片側検定にするた めに、2で割ります。 • この数値を有意水準と比較します。 • 片側検定の結果(C22)が、「分散が等しい」確率です。この確 率が有意水準よりも小さければ、「分散が等しい」という帰無 仮説が棄却され、不等分散であると言えます。 昔ながらの数表確認 • 現在のやり方(直接確率を計算する方法)では、もう使いませ んが、有意水準0.05の時に、与えられた自由度でF値がいくつ になるか、念のために表示してみます。 • 両側検定の場合には、有意水準を2で割って0.025として数表 から読みます。 • 現在は、数表を使わなくても、Excelで計算できます。 • C24のセルには =IF(C16>D16,F.INV(1-$C$20/2,C18,D18),F.INV(1-$C$20/2,D18,C18)) • C25のセルには =IF(C16>D16,F.INV(1-$C$20,C18,D18),F.INV(1-$C$20,D18,C18)) • を入力します。 t値の計算 • t値を計算します。t値の計算式は、文献により何通りかありま すが、ここでは以下の式を用いました。 x1 − x2 t= 1 1 s + n1 n2 • ここで、計算に用いた分散Sは、二つの事象の分散から合成 しました。 s12 (n1 −1) + s22 (n2 −1) s= n1 + n2 − 2 t検定 • Excelでのt検定は、T.TEST()です。 • 第一引数と第二引数は、データ配列です。 • 第三パラメータは、1ならば片側検定、2ならば両側検定です。 • 第四パラメータは、1ならば paired-t(対応のあるt検定)、2なら ば等分散の独立2変数、3ならば、不等分散の検定です。 • ここでは、F検定の結果から第4パラメータを与えるようにして =T.TEST(C4:C12,D4:D12,1,IF($C$20>$C$22,2,3)) • の式を入力しました。 検定結果の判定 • t検定の結果は、T.TESTの値が有意水準の確率と比べて大き いか、小さいかで判断します。 • T.TESTの結果は、「二つの標本集団が、平均値が同じ母集 団の一部である(データの統計的性質が同じ)確率」を表して います。この値が小さい、ということは、二つの統計的な性質 は違う、ということを意味します。 • 両側検定の結果が1%だったということは、1%の確率で両方 のデータが同じである、つまり、(1%というのは小さい値なの で)、二つの統計データは異なる、つまり、この課題では、「Aク ラスと、Bクラスとでは、実力が異なる」:という結果が、1%の 危険率で示されたことになります。 昔ながらの数表検索 • 直接確率を計算してしまっているので、0.05(5%)の危険率 を設定しても、全然意味がなかった、ということにはなりますが、 棄却域が5%に設定されているならば、この確率と比較して有 意差のあり、なしが求められます。 • そもそも、昔は数表で調べていましたが、有意水準と、自由度 (二つの和)を与えて、数表から検索しました。 • この値を計算したt値と比べて、t値の絶対値の方が大きかった ら「有意差あり」と判定していました。 • 現在は、以下のような関数式で計算できます。 計算部分のEXCEL関数式 STDEV.Pか STDEV.Sか、 注意深く選ぼう 危険率の値 • 昔のやり方の場合には、数表が不可欠でした。 • 現在は、直接確率を求めることができるので、元のデータから、 前ページの色塗りした部分の式を入力するだけで、有意差の 判定ができます。 • 論文などを読むと、危険率の値として1%とか5%などが使わ れていますが、これは、統計数表にこれらの値しか用意されて いなかったためです。 • 現在は、1.3%でも0.41%でも、任意の値に危険率を設定する ことができます。棄却水準という言い方ではなく、「帰無仮説の 成立確率が0.23%なので」などという言い方をしても正しいは ずですが、論文などを書く場合には昔からの言い方の方が無 難かもしれません。 今日の授業課題 • 今日の授業スライドのP9の、免疫グロブリンのデータを処理して、 有意差の有無を論じて下さい。 • EXCELのシートに数式を入れて、結論を出すだけではなく、論文調 に、「目的」と、「仮説」、「計算結果」、「結論」をできればデータシート とは別のシートに記して下さい。 • ここまでの課題で数式が入れてあれば、データ部分を行拡張してデータを 入れ替えるだけで結果は出せます。 • 最高点6点で計算します。 • 標準偏差の計算式などに誤りがあった場合には、減点します。 • また、「結論」に使われている言葉(帰無仮説や、対立仮説など)の使い方に 誤りがあったり、あるいは、言葉できちんと結論を出していない場合にも、減 点します。 • 課題ファイル名は、「学籍番号-13.xlsx」でお願いします。 次回の予告 • 【第14回】計測と伝達関数、論文に見るデータ処理 • シラバスより以下の部分を変更して扱います。 • 【第14回】論文に見る計測データの処理 • 学術論文における「計測データ」の処理方法を読む。計測データは適切な処理を行わないと結 論を導くことが困難であるため、どんなデータから何が言えるか、危険率や統計検定、回帰直線 や、相関係数を実際に求めている論文を読んで、それらの指標の重要性を学ぶ。 • コンパートメント・モデルを紹介し、計測データから特性を調べる計 算処理を行います。また、時間に余裕があれば、最新の学会誌から 論文を紹介して、実際のデータ処理を読みます。 • コンピュータ演習室の使用は、今回だけです。 • 次回から、一般教室に戻ります。 欠席した人は・・・ • 今日の授業課題を提出して下さい。 • 提出があれば、出席に切り換えて、レポートも採点評価します。
© Copyright 2024 Paperzz