日常の検査数値の取り扱いと発表のための統計処理

日常の検査数値の取り扱いと発表のための統計処理
2012 年
内海
隆(医療法人 内海眼科医院)
川瀬芳克(愛知淑徳大学)
第 66 回日本臨床眼科学会
コメディカルプログラム
視能訓練士プログラム
テキスト
Q は事前に提出された質問への回答が含まれている個所です
2012 年 10 月 28 日(日) 9:00~10:30
国立京都国際会館 アネックスホ-ル1
0
Ⅰ.数値の尺度と視覚化
1)数値の尺度
対象や現象の特性に対して数値を割り当てる基準を尺度と言います。尺度には次の4種類があり、そ
れにより適用できる統計手法が制限されます。
1.名義尺度(分類尺度):
分類を行うもので個数を数えたり、割合を求めたりすることができます。
例:性別(男性1,女性2として性を分類する)など
2.順序尺度(序数尺度):
大小関係などの順序に従っているが、各値の間隔が等しくないもの。中央値や範囲、順位相関
係数などを求めることができます。
例:治癒度、視角からみた小数視力値
3.間隔尺度:
大小関係などの順序関係に加え、各値の間隔が等しくなっているもの。算術平均、標準偏差、
ピアソンの相関係数などを求めることができます。
例:温度など
4.比例尺度:
間隔尺度の性質に加え、零点があるため比を求めることができるもの。すべての統計処理が可
能です。
これらのうち、名義尺度と序数尺度を質的尺度、間隔尺度と比例尺度は量的尺度と表現することもありま
す。また、間隔尺度と比例尺度は厳密には異なるものですが、間隔尺度を比例尺度のように扱うこともあり
ます。アンケートの回答に用いられる3段階以上の評価は多くの場合、序数尺度ですが、評価項目に数値を
与えることなどにより、しばしば間隔尺度のような扱いをされることがあります。便宜上の操作ですが、評
価項目が標準化されていない場合には誤りです。
2)データの視覚化
最初に行う統計処理はデータの視覚化です。数値あるいは分布の特徴を捉えるために代表値やばらつきを
求めますが、それに先立って個々のデータをグラフ化することで、データを吟味するとともに、分布の特徴
を捉えることが大切です。個々のデータを表示するには散布図や幹葉表示などがあります。ひとつの変数の
分布の形を見るためには名義尺度の数値に用いられる棒グラフや円グラフ、順序尺度に用いられる箱ひげ図、
量的なデータに対して用いられるヒストグラムなどがあります。箱ひげ図では外れ値の表示も可能です。
3)代表値と散布度
分布を要約してあらわす値に代表値とばらつきがあります。
分布の中心位置を示し、その分布をひとつの値で表したものが代表値です。間隔尺度以上では算術平均(以
下、平均値と表現します)が代表値として用いられます。A群での平均眼圧は 14mmHg であるのに対し、B群
1
では 17mmHg であった、というような表現がされます。A群にもB群にも高い値から低い値までさまざまな眼
圧値が含まれているはずですが、それらを平均値というひとつの値で要約し、代表しています。
順序尺度では中央値を代表値として使います。これら以外では最頻値(モード)がありますが、使われる
頻度は低いようです。
散布度は分布のひろがり、ばらつきの程度を示すものです。間隔尺度以上では標準偏差が代表的なもので
す。順序尺度では範囲や四分位範囲などが用いられます。
[参考]
1.標準偏差と標準誤差
Q
標準偏差(SD=standard deviation):測定値のばらつきを示しています。
標準誤差(SE=standard error):統計量のばらつきを示します。一般には平均値のばらつきを示します(平均
値の標準誤差 SEM:=standard error of mean)。標本抽出を多数回行った場合、その回分だけの平
均値が求められ、平均値の分布が得られます。その分布の標準偏差が標準誤差です。2群の平均
値の差を比較する t 検定では2群の平均値の差の大きさを標準誤差で測っています。個々のデー
タのばらつきを標準偏差で測るように、平均値のばらつきを標準誤差で測っているわけです。こ
うしたときに標準誤差は使います。
2.分散と不偏分散、母標準偏差と標本標準偏差
分散と標準偏差:分散はデータのばらつきを示しています。平均値との差(平均偏差)をデータごとに求
めます。それを合計しますと零になってしまうため、平均偏差を2乗します。2乗することですべての値が
正の値になり、合計値が零にならないことのほか、大きい差はより大きく、小さい差は小さくすることがで
き、ばらつきの傾向をより明確にする効果があります。この合計値(偏差平方和)をデータの数nで割りま
す。すなわち、分散は個々のデータのばらつきの平均値で、これによりばらつきの程度を示しているもので
す。
分散の平方根が標準偏差です。分散は偏差を2乗しています。平均偏差を長さに例えますと、分散では差
の大きさを面積で示していることになります。これを元の長さに戻すためには平方根を求めれば良いことに
なります。すなわち分散の平方根を求めますと元の単位でばらつきを示すことができます。これが標準偏差
です。
分散と標準偏差の定義には母集団や標本という概念は入っていません。すなわち得られた値(データ)に
ついて定義しているものです。これを母集団や標本を扱う場合に当てはめますと、分散も標準偏差も対象と
している集団(母集団)のすべての値が分かっている場合に相当します。たとえば対象について悉皆調査(全
数調査)を行う場合などにあたります。このときの分散を母分散、標準偏差を母標準偏差と表現することが
あります。
不偏分散と標本標準偏差:不偏分散は標本から母集団の分散(母分散)を推定するときに使われるもので
2
す。推定値が大きく偏ることもなく、小さく偏ることもなく最も良い値となるのが不偏分散です。個々の平
均偏差を合計し偏差平方和を求めるところまでは分散と同じです。偏差平方和を分散ではnで割りましたが、
不偏分散では(n-1)で割ります。これは自由度で割るということで両者を統一的に説明できますが、こ
こでは省略します。この不偏分散の平方根が標本標準偏差で、標本から母標準偏差を推定しているものです。
いわゆる「標準偏差」を求める際、標本数が 30 未満あるいは以下であるときは(n-1)で割り、それよ
り多いときはnで割る、と説明がされていることがあります。(この場合の 30 は一律ではなく、25 など他
の数値である場合もあります)
これは理論的には不正確です。標本から母標準偏差を推定するときは標本数に関わらず(n-1)で割り
ます。全数が分かっており、そのデータのばらつきを示すときはnで割ります。
一方、nが 30 より多いときはnで割っても、(n-1)で割ってもその値にはほとんど差がないことも
多いです。実用的かつ簡便な方法として紹介されているのかも知れません。エクセルではそれぞれに関数が
用意されていますので、適切なものを選択してください。
Ⅱ.統計処理の基本
1)母集団と標本
母集団:標本抽出の母体となる集団で、全体の集合となっているものです。研究対象となっている全体
の集団で、定義されていることが必要です。
標本:母集団から抽出された数値の集まりをいいます。具体的には観察あるいは検査を行った対象ある
いはそこから得られたデータをいいます。
推測統計学(推計学)では標本を用いて母集団の評価を行います。検定や推定においては標本が母集団か
ら無作為抽出されたものであることがもっとも大切です。
2)正規分布とその他の分布
正規分布:連続分布の中で最も基本となる重要な分布で、生態系や生体などに関する測定値の分布に広
くみられます。正規分布は無数にありますが、平均値と標準偏差によりある正規分布に特定さ
れます。平均値を 0、標準偏差を 1 としたものを標準正規分布、あるいは規準正規分布といい、
基本的な分布として統計処理に用いられます。統計書の巻末に正規分布表として掲載されてい
るものです。正規分布では平均値を中心とし±1.96SD(標準偏差)の中に全体の 95%が含まれ
ます。
t 分布、χ2 分布、F 分布:正規分布以外で統計学で大切な分布です。これらの分布を理解することは統
計処理の内容を知ることにつながります。詳細は省略します。
その他の分布:一様分布から不規則な分布まで様々な分布が考えられます。先に述べましたデータの視
3
覚化によりその分布を確認してください。適切な統計手法を選択する際の基準のひとつとなり
ます。
3)正規分布と信頼区間
正規分布では、平均値±1SD の間に 68.3%、平均値±2SD の間に 95.453%、平均値±3SD の間に 99.73
%が含まれます。平均値±1.96×標準偏差の間には 95%が含まれます。この区間を信頼区間ともいいます。
4)パラメトリック検定とノンパラメトリック検定
Q
先に述べましたように無数にある正規分布ですが、平均値と標準偏差が決まりますとある特定のひとつの
正規分布になります。このようにその分布の形を決めているものをパラメータといいます。検定にこのパラ
メータを用いる方法をパラメトリック検定と呼び、検定に平均値と標準偏差などを用います。
一方、パラメータを用いない方法をノンパラメトリック検定といい、この場合は大小等の順位数を用いま
す。
t 検定や分散分析などを代表とするパラメトリック検定では、母集団が正規分布かそれに近似しているこ
と、各条件の母分散が等質であること、標本が無作為に抽出されていることなどが満たされている必要があ
ります。母分散が等質でない場合、t 検定ではウェルチの検定を用いるなどの対応が必要です。前提条件が
満たされている場合には比較的検出力が一般に優れています。
これらの条件が満たせないときや尺度が低い場合はノンパラメトリック検定を用いることになります。た
とえば t 検定の代わりにマン・ホイットニの検定を用いるなどです。
5)検定の考え方と p 値 Q
標本の差から母集団の差を判断するもので、推計学の代表的な統計手法です。さまざまな手法があります
が、考え方は同じです。2群の平均値を比較する場合を仮定して考え方を紹介します。
2群の標本の平均値に差がみられても、ただちに母集団において差がある、とは言えません。母集団の間
には差が認められない、という仮説を立てます。これを帰無仮説といいます。帰無仮説のもとで標本に見ら
れた差が生じる確率を計算します。その確率が小さいときには、母集団においては差がないとする「帰無仮
説」を棄却し、母集団において差が認められる、とする対立仮説を採用します。2群の平均値に有意差が認
められた、という判定を採用します。
帰無仮説のもとで標本の差が生じる確率が小さくないときは帰無仮説が棄却できません。この場合は2群
の平均値に有意差が認められない、という判定を採用します。
小さい確率について説明します。一般に5%を基準とし、確率が5%未満の場合に帰無仮説を棄却し、対
立仮説を採用します。これを5%の有意水準で有意差が認められた、とか危険率5%未満で有意差が認めら
れた、と表現します。この有意水準は差があることの確からしさを示す指標で、差の大小を論じているもの
ではありません。さらにこの有意水準は1%、0.1%と小さい値により、より強い確からしさを示すことがあ
ります。
有意水準、危険率という用語の意味を述べます。あくまで標本からみた母集団の評価です。両者の分布や
4
特性が一致していないときにはその判定が誤りであることもあります。危険率5%未満で有意差が認められ
る、ということは、標本の差から推定し母集団において2群の平均値に差がある、という結論が間違ってい
る確率が5%未満であることを意味しています。有意水準も同じ意味です。
Ⅲ.検定法各論
Q
検定法を選択において大切なのは、データの尺度、対象となる群数、対応の有無(独立か対応があるか)
です。これらを基準に代表的な検定法を紹介します。
1)1群の検定
母平均の検定など(省略)
2)独立した2群の差の検定
(1)独立2群の平均値の差の検定:t 検定
(2)独立した2群の順位の差の検定:Mann-Whitney test(マン・ホイットニ-検定)
3)対応のある2群の差の検定
(1)対応のある平均値の差の検定:対応のある t 検定
(2)対応のある順位の差の検定:Wilcoxon signed rank test(ウィルコクソンの符号付き順位検定)
4)独立した多群の差の検定
(1)独立多群の平均値の差の検定:一元配置分散分析
(2)独立多群の順位の差の検定:Kruskal-Wallis test(クラスカル・ワリス検定)
[参考]
3.多重比較の必要性
Q
近年、多重比較が多用されるようになっています。SPSS などの専門的な統計パッケージだけでなく、エ
クセルのアドインソフトにも多重比較のメニュが用意されるようになり、手軽に使えるようになったことも
その理由かと思います。この多重比較の必要性について簡単に説明いたします。
独立の3群の平均値の差を検定することを例に取ります。3群をA群、B群、C群とし、一元配置の分散
分析を行った結果、5%の危険率(有意水準)で有意という結果が得られたとします。これは3群のうち少な
くとも1群の平均値が他のいずれかの群の平均値と有意に差がある、ということを意味しています。その差
がどの群間にあるかは示していません。ただこの判定を導くときの危険率は5%未満で確保されています。
どの群の間で差があるかを見るため3群の中で対比較を行ったとします。すなわちA群とB群、B群とC
群、C群とA群の組合せで独立2群の平均値の差の検定であるt検定を3回行ったとします。それぞれ危険
率(有意水準)は5%未満とします。母集団においてこれらの3群間にはまったく差がない場合、A群とB
5
群の間で平均値に差がないという判定が出る確率は0.95です。B群とC群、C群とA群での比較でも同様
です。3回の検定でいずれも有意差なしという判定になる確率は0.95×0.95×0.95で計算できます。
結果は0.87です。これは3群のいずれの間にも差がないにもかかわらず、少なくともいずれかの群間で差
があるという判定が出る確率が0.13であることを意味しています。母集団に差がないにもかかわらず、標
本の分布から差があると判定しまう確率を5%未満に抑えているのが、危険率あるいは有意水準の意味して
いるものです。しかし、3回のt検定を繰り返すことで危険率が13%にまで高くなっているわけです。こ
れを解決するため、すべての組合せで差の検定を行いながら全体の危険率が5%未満になるように考えられ
たのが多重比較です。
5)対応のある多群の差の検定
(1)対応のある平均値の差の検定:二元配置分散分析
(2)対応のある順位の差の検定:Friedman test(フリ-ドマン検定)
6)計数値の検定
(1)Chi-square test(χ2(カイ二乗)検定)
(2)Fisher's exact probability test(フィッシャ-の直接確率計算法)
7)相関と回帰
Q
2つの検査値の関係を検定するもの
まず、散布図を書くことが大切
(1)相関係数 correlation coefficient
XとYの間に因果関係があるかないかよくわからない
XとYの増減の一致の度合いを検定
例=屈折値と視力
まず p で相関がないことを否定=相関があることを検定
p<0.05、 p<0.01、 ……の場合
→相関係数rを求めることを許す
→その結果;
r:
Q
~0.2
相関がほとんどない
0.2~0.4
相関がややある
0.4~0.7
相関がかなりある
0.7~1.0
相関が強い
測定値が間隔尺度で単純変化の場合にのみ単相関分析(Pearson)可能
-パラメトリック検定
測定値が間隔尺度で単純変化でない場合
順序(序数)尺度の測定値の場合
Spearman とか Kendall の相関分析が適応
6
-ノンパラメトリック検定
Q
(2)回帰分析 regression analysis
測定値Yを別の測定値Xで予測する予測式
測定値Yをその原因の測定値Xで予測
Xには誤差はない
例=オ-トレフAとオ-トレフBの値の比較
直線回帰 simple linear regression
回帰直線 regression line
y=a+bx 1次式なので1次回帰ともいう
b:回帰係数(=回帰直線の傾き) regression coefficient
二次多項式による回帰:y=a+bx+cx2
指数回帰:y=a×bX
べき乗変換回帰:x軸のデ-タを次のように変換した後に回帰を検定する
自然対数
logeX、常用対数
log10X 、eX 、10X 、実数乗
Xa
Stepwise 重回帰分析:y= a+b1x1+b2x2+b3x3+……
間隔尺度以上にのみ適応
8)ブランド-アルトマン法(Bland-Altman plot)
(差分値プロット:difference plot) Q
同じ物理量(たとえば屈折値)を2つの方法(器械)
たとえばA社とB社のオ-トレフで測定したとき
縦軸にA社とB社のレフ値の差、横軸にA社とB社のレフ値の平均をとって散布図を作る
縦の散らばりが大きい→エラ-(ランダム誤差)が大きい.
縦と横に相関がある→比例誤差の存在.どちらかに補正率をかけて調整する必要がある
縦の散らばりの中心が0からずれている→加算誤差の存在
原点の位置を調整必要
縦の分布が右にいくほど広がっている→どちらかの測定方法で測定値が大きいほど誤差が大きい
回帰分析(とくに一次回帰)では、よくできた2つの器械の測定値に大きな差が出るはずがない
測定範囲が狭くエラ-が多い測定値の場合は誤判定しやすい
9)多変量分析
Q
複数の測定値を組み合わせて関連づける
例)調節内斜視の裸眼遠見時の眼位
=a×屈折値+b×年齢+c×立体視の視差
(1)Spearman's correlation coefficient
スピアマンの相関係数(順位相関行列)
7
(2)Kendall's coefficient of confidence
ケンド-ルの順位相関係数
(3)Partial correlation coefficient
偏相関係数(偏相関行列)
10)アンケ-トの結果の統計分析
種々のアンケ-ト項目の結果を点数化したスコアは順序尺度なので、間隔尺度のように平均を求める
ことは許されない!
中央値(median)が出番となる.最頻値(mode)でもかまわない
とくに最近は、心の問題(満足度・QOL など)を数字にすることが常識化している
例)患者さん視点のQOL評価
アウトカム評価
VFQ-25、AS-20
Patient Reported Outcomes (PRO)
例)見えにくいために思い通りにやり遂げられなかったことが?
いつもほとんど>ほとんど>ときどき>まれに>まったくない
各回答に点数を付けて分析していく
対応のある比較は可能だが、平均値を出したり、治療で総点数が増加したという表現は許されない
QOLの本来の意味はどこへ??
11)統計分析の注意点
(1)統計学的有意差あり≠生物学的に意味がある
=false positive (第1種のエラ-)
統計学的有意差なし≠生物学的に意味がない
=false negative (第2種のエラ-)
(2)判断をいかに下すか
科学者の経験・知識と良心(見識)に従って判断すべき
A)統計学的有意差なしだが本当は有意差あるはず
→違う傾向がある
B)統計学的有意差ありだが本当は有意差ないはず
→有意差あるも差は僅かであった
ここに一種の phylosophy の側面が伺える
そこで、A)実験を追加し、例数を増す
B)安全かつ他に悪影響を及ぼさない結論を読む
(3)用いる手法
同種の研究・実験では同じ検定を用いる
8
12)デ-タ処理
(1)有効数字
時間あれば最後に
Q
1.通常は3ケタまで
2.途中で四捨五入せず、計算機の表示に任せよ
書き出しは最終段でのみ行い、途中でしないこと
3.平 均 値:+1ケタは可能(n=100 程度なら+2ケタも可)
4.標準偏差:+1ケタは可能(n=100 程度なら+2ケタも可)
(2)ケタ落ち
1.12.2-12.1=0.1 のように有効数字のケタが減ってしまうこと(本当は 00.1)
2.同じような数字の引算は計算の後段~最後にせよ
3.計算機をたたく場合は、できる限りメモリ-を使うか6ケタ以上を keep すること
(3)四捨五入(まるめ)の誤差
1.5を常に切り上げるとデ-タを偏らせてしまう
1,2,3,4,
5→6,7,8,9,
2.JIS 2840 ル-ル
左隣が奇数なら切上げ
左隣が偶数なら切捨て
→結果として最終ケタが全数値とも偶数になる
ex)25→2,75→8
13)統計手法の学習法の例と教科書・参考書になる書籍
Q
統計を学問としてではなく、研究に必要な知識や手法として学習されたい場合を想定して筆者の私見を述
べます。多数の異論もあるかと思いますが、参考意見のひとつとしていただければと思います。
まず、簡便な方法はありません。じっくり基礎から学ばれるのが最善で最速の道と思います。学び方の例
やコツを紹介したいと思います。
(1)考え方を理解するための本を1冊読み通し、全体の枠組みあるいは筋道を理解する。
(2)簡単な統計処理を電卓で行い、計算の意味を理解する。
(3)基本的な統計手法についてシミュレーションを行って内容を理解する。
(4)継続的な勉強会に参加する。あるいは独学できる書籍を探す。
(5)統計手法について他の人に解説する。
(6)統計パッケージの操作法のみでなく、出力について丁寧に解説している書籍を利用する。
最初に統計を学習しようとするとき、どの本を読めば良いのかについて迷うと思います。筆者は
1)の推計学のすすめを薦めています。この本は新書で、数式が少なく教養書として読むことができます。
内容としてはやや古く、最近の知見は記述されていませんが、推計学とくに検定の考え方が分かりやすく記
述されています。まずこの本を一読あるいは二読されて検定の考え方を学習してください。すべての検定法
9
に共通の考え方です。その後の学習が楽になります。同様の読み物として、蓑谷千凰彦著「推測統計のはな
し」(東京図書)、同著「統計学のはなし」(東京図書)、石村貞夫著「統計解析のはなし」(東京図書)、
大村平著「統計のはなし」(日科技連)など多くの書籍があります。各論については石村貞夫著「分散分析
のはなし」(東京図書)、蓑谷千凰彦著「回帰分析のはなし」(東京図書)などがあります。いずれも記述
が丁寧であることが特徴です。この中では大平著「統計のはなし」がやや平易で分量も少ないように思いま
すが、これも含めて独学で初めての本として読みとおすにはやや重いという感じがします。少人数の勉強会
で輪読用として取り上げるのであればいいかもしれません。内容がしっかりしていて、読み通せる平易な本
はなかなかありませんが、その例として後述の文献1)を挙げたいと思います。ただこの段階では実際のデ
ータ処理は困難です。
2)の手計算についてです。たとえばエクセルを使いますと標準偏差は関数を選択するだけで得られます。
どのような過程を経てその値が出てきたのかは不明です。SPSS は機能が高い統計パッケージで、記述統計を
選択しますとすぐ標準偏差を含む基礎統計量が出力されます。これで標準偏差が理解できればいいのですが
難しいと思います。
集計表に従って平均値、平均との偏差、偏差平方、偏差平方和と順に手計算することで何をしているのか
が理解できると思います。この方法はχ2 検定や t 検定あたりまでは比較的容易です。自分の手で計算をして
みることでその内容が理解しやすくなると思います。手計算が難しくなってきたときや、実際例を処理する
ときにはエクセルのアドインソフトである4)は使いやすいソフトです。使い方と出力の解説が丁寧です。
3)のシミュレーションについてです。私はχ2 検定を理解してもらうために色厚紙の小片を使っていま
す。詳細は省略しますが抜き取り実験が簡単にでき、母集団と標本の関係、検定の意味とその検定力などが
体験できます。t 検定についても少し道具を用意することでシミュレーションが可能です。市販の道具とし
てはノーマルチップなどがありますが、意外と高価です。自作できます。
石川幹人著「サイコロとエクセルで体感する統計解析」(共立出版)という本があります。意図はタイト
ル通りですが、内容は必ずしも平易ではなく、むしろ中級者用と感じました。
現在では絶版になっているようですが、3)は手法の実際だけでなく、その内容をシミュレーションによ
り解説している優れた本で、独学あるいは学習会で取り上げるのに適切なものかと思います。もし手に入れ
ばご覧になってください。
適当な指導者がいれば、4)の勉強会、学習会は有効と思います。初心者ばかりでは難しいです。月に一
度程度の間隔で2時間程度、わかりやすいところからじっくりと進めることがコツです。1年から2年を掛
けてノンパラメトリックな手法から分散分析までを学習するというペースが良いと思います。指導者が講義
をすることでも、輪番で講義を担当し指導者が解説をするということでもいいと思います。できるだけシミ
ュレーションを取り入れ、内容を具体的に理解することを試みてください。また典型的な例題を演習として
取り上げることも必要です。2)は統計学の教科書です。独学で読むには難しいですが、指導者がいれば基
礎統計の入門書になります。ただし、シミュレーションなどの手法は使われていません。
10
ひとりで勉強しなくてはならないときは通信教育を利用する方法もあります。ひととおりの力をつけるこ
とができると思います。
独学で、という場合はテキストを選んでください。ロウントリー著(加納悟訳)「涙なしの統計学」(啓
明社)の旧版のように書き込み式になっているものを選択する方法もあります。また粕谷英一著「生物学を
学ぶ人のための統計のはなし
きみにも出せる有意差」(文一総合出版)のように統計の基礎知識と基本的
な検定手法が例題をもとに図と会話形式で解説されるものもあります。根気が必要ですが初学者の独学には
有効かもしれません。こうした本を書店の店頭で探してみてください。
5)は4)の学習会にも重なります。他の人に解説することは一番いい勉強法かと思います。効率のいい
勉強法と考えぜひ試みてください。
6)はとくに個別の手法の理解に有効です。竹原卓真著「SPSS のススメ1」、「同2」(北小路出版)
は SPSS を利用して分散分析をする場合にレファレンスができます。同様に石村貞夫著「SPSS による分散分
析と多重比較の手順」(東京図書)は SPSS の操作と出力の簡単な見方には役に立ちます。5)や6)はその
例として挙げました。7)では眼科領域での例題を取り上げ基礎統計から生存分析まで広く紹介されていま
す。
手計算やシミュレーションをお薦めしましたが、理解のための計算を除けば統計パッケージと言われるソ
フトを使われるのが便利かと思います。このなかには SAS や SPSS などの本格的なものから4)のようなアド
インソフトまで幅広く利用されています。4)は価格も 4,000 円と比較的手頃です。ご自身の使用条件に合
わせて選択されるのが良いと思います。なお、論文にて統計パッケージとして認められやすいのは前述の本
格的なものです。
ここまで思いつくままに学習法について述べてきました。参考にしていただければ幸いです。
1)佐藤信
:推計学のすすめ、講談社ブルーバックス、1968(2011
第 67 刷)
2)山内光哉:心理・教育のための統計法(第3版)、サイエンス社、2009
3)市原清志:バイオサイエンスの統計学、南江堂、1990
4)柳井久江:4Steps エクセル統計(第3版)、オーエムエス出版、2011
5)吉村功:毒性・薬効データの統計解析、サイエンティスト社、1987
6)永田靖・吉田道弘:統計的多重比較法の基礎、サイエンティスト社、1997
7)大鹿哲郎、谷原秀信、平形明人、岡田アナベルあやめ:オキュラーサイエンス.眼科臨床医のための基
礎医学と実際統計学、医学書院、1995
11
Ⅳ.視力-数値の扱いとして-
Q
1)視力は感覚をあらわす数値だから、Weber-Fechner の法則により、対数化して扱わなければならない
対数視力=log(10×小数視力)
字詰まり視力表には 0.1~1.0 の間は 0.1 きざみで視標が置かれている
小数視力の対数視力を計算すると、
小数視力
対数視力
0.1
0
0.2
0.3
0.3
0.5
0.4
0.6
0.5 0.6 0.7
0.7 0.8 0.85
0.8
0.9
0.9
0.95
1.0
1.0
となって、対数視力の値が 0.1 きざみでないことに気付く
対数視力 0.1・0.2・0.4 の視標もない!
そこで、0.1 きざみになるように視標を加える;
小数視力
対数視力
0.125
0.1
0.15
0.2
0.25
0.4
の3つの視標を作り、加えなければならない-A
0.7 と 0.9 は統計計算時には 0.6・0.8 として扱わなければならない-B
このAB2つのことができていなければ、測った視力の平均も検定もできない!
0.7 と 0.9 は1/2段階の視力値で、非常に細かい仕事の値である
0.7p、0.8p、0.9p、1.0p は1/4段階の刻みの視力値となり、細かすぎる表示であることを知る
2)視力の平均を求める方法
演習)小数視力
0.2 と 0.8
A)(0.2+0.8)÷2=0.5
の平均は?
まちがい
B)対数視力に変換して平均し、10Xを使って小数に戻す
0.2 の対数視力=log(10×0.2)=log2=0.301
0.8 の対数視力=log(10×0.8)=log8=0.903
(0.301+0.903)÷2=0.602
100.602 =4.00
→ 4.00÷10=0.400 -これが正解
3)視力の分布を求める方法
問題)対数視力で平均値±標準偏差を求めたら 0.6±0.1 になった、これはどんな分布か?
分布は平均値±2×標準偏差だから
この場合の分布は対数視力で(0.6-0.1×2)~(0.6+0.1×2)となる
=0.6-0.2~0.6+0.2 の分布となる=0.4~0.8 の分布となる
これを小数視力に直すと
100.4=2.51、100.8=6.31 となり、それぞれ 10 で割って
→ 0.25~0.63 の分布にあるということができる
対数視力の平均値 0.6 は
小数視力では
100.6÷10=0.40 となる.
12
→小数視力であらわすと、平均 0.40、 分布 0.25~0.63、となる
平均 0.40 中心の対称的な分布にはならない
4)ETDRSチャ-トの優れた点
ETDRS= Early Treatment Diabetic Retinopathy Study Research Group
= 糖尿病網膜症早期治療研究グル-プ が 1985 年に採用した視力表
網膜硝子体領域、Low Vision 領域で治験などに盛んに用いられている
Log MAR を用い、対数を使っていること
log MAR=log 最小視認角(Minimum Angle of Resolution)(分)
小数視力=最小視認角の逆数=1/最小視認角(分)=1/MAR
対数視力=log(10×小数視力)
=log(10/MAR)
=log 10 - log MAR
=1- log MAR
→ log MAR +対数視力=1
小数視力
0.1
0.125
0.15
0.2
0.25
0.3
0.4
0.5
0.6
0.8
1.0
対数視力
logMAR
0
1.0
0.1
0.9
0.2
0.8
0.3
0.7
0.4
0.6
0.5
0.5
0.6
0.4
0.7
0.3
0.8
0.2
0.9
0.1
1.0
0
→ マイナスの数字
5)ETDRSチャ-トの問題点
(1)検査距離が4mと短い=調節が5mの場合よりも介入する
(2)視標間隔が規定よりも狭い
=左右は1字分・上下は下段1字分しかない
=正常者でも字詰まりによる視力低下→本来の視力より低い視力値になる
昌原英雄ら:視覚の科学 24(2003): 21-21
滝本正子ら:眼紀 51(2000): 1153-1156.
(3)一段下の視標を1字読めたら log MAR で 0.02 分引いて視力の中間値を算出する
=視覚生理学的に誤った簡便法
視覚確率曲線は低視力域では直線になっていない
(4)5個の視標が全て 100%読める視標を視力値にしている
=視覚生理学的にまちがい
=閾値の概念から 50%超を視力値とするので、真の視力値よりも悪く出る可能性がある
(5)各基準による視標の間隔の規定
a.ISO/DIS
視 力
~0.05
8596 基準 → 2002
視標間隔
2×ラ環切れ目幅
JIS
T 7309
実際の間隔(mm)
58.2~
0.06~0.125
1×ラ環外径
58.2~121.2
0.16~0.32
√2×ラ環外径
32.2~ 64.3
13
0.4 ~1.0
2×ラ環外径
14.5~ 36.4
1.25~
3×ラ環外径
~
5.8
b.万国式試視力表では実際:30~60mm もある
c.ETDRS表ではこれらよりはるかにせまい
d.視標間隔が視標の 2.5 個~3個分あれば字詰まりによる視力低下は避けられる
湖崎
克ら:神経進歩.22:1001-1014, 1978
トレンネングストレ-ナ-(山地良一、Bangerter
1955)を使った研究
(6) 弱視領域では Lea Symbols を使ったETDRSチャ-トが使われている!
(7)ETDRS表は決して視力表の gold standard ではない!
14