カテゴリ項目テスト得点と真値の関連度指標について

カテゴリ項目テスト得点と真値の関連度指標について
種々の信頼性係数およびテスト得点と真値の間の決定係数の比較
○岡本安晴 1
(1 日本女子大学人間社会学部)
キーワード:信頼性係数、決定係数、カテゴリ項目
On indices of relations between categorical test scores and true values
Yasuharu OKAMOTO1
(1Japan
Women’s University)
Key Words: reliability coefficient, coefficient of determination, categorical item
目 的
心理尺度の測定値Xが連続量の項目 の和で与えられると
き、真値Tと誤差Eの和X = T + Eに分解され、測定値(観測値)
Xと真値Tとの関係(精度)を表す信頼性係数はω = ( )⁄ ( )
で与えられる。測定値Yが、カテゴリ項目 の和で与えられる
ときは、
(1)
= ,
≤ <
とモデル化され、ωは の回答パターンから推定できる
(Okamoto, 2013)
。平行テストの得点Y′を考えて、YとY′の相
関係数
を信頼性係数とする提案もある(Green and Yang,
2009)
。カテゴリ項目への回答を数値として扱ってα係数を求
めることも広く行われている。しかし、カテゴリ項目の場合、
測定値はXではなくYであって、信頼性係数ω、
あるいはα
は、測定値Yと真値Tとの関係を示すものではない。ωはXの特
性、
とαはYの特性を表すものである。岡本(2013, 2014)
は、YとTとの関係を
(2)
T = aY + b + e
と表して、回帰モデル(2)の決定係数 によって、測定値Y
と真値Tとの関係の強さを表すことを提案している。ただし、
決定係数 のことを岡本(2014)では予測信頼性係数 と呼
んでいる。YとTの関係はモデル(1)を介して表されるので、
Xの特性を表すωや、Yの特性を表す
およびαより、YとTの
関係 は弱いと考えられる。すなわち、信頼性係数は、測定
値Yと真値Tとの関係を過大評価するものであると考えられ
る。信頼性係数ω、
、αと決定係数 との比較をシミュレ
ーションによって行ったので、以下に報告する。
シミュレーション
各テスト項目 、
・・・、 が次のモデルで表されるとする。
=
+ , ~ (0, 1),
=1−
カテゴリ境界は、
カテゴリ数=7のとき
= −1.23,
= −0.738,
= −0.246,
= 0.246,
= 0.738,
= 1.23
カテゴリ数=3のとき
= −0.25,
= 0.25
カテゴリ数=2のとき
=0
とする。
平行テスト
=⋯=
= 0.7
の場合と、非平行テスト
= 0.9、 = 0.8、 = 0.7、 = 0.6、 = 0.5
の場合について、信頼性係数ω、
、αと決定係数 を求め
たものを図1および図2に示す。図1および図2のいずれの
場合も、信頼性係数は、測定値Yと真値Tとの関係(2)の強
さを表す より大きく、この傾向はカテゴリ数が2と3のよ
うに小さいときに顕著である。
結 論
信頼性係数は、カテゴリ項目の場合、測定値Yと真値Tとの
関係を過大評価するものである。測定は、真値を推定するた
めに行うことを考えれば、測定値と真値との関係を表すもの
として信頼性係数ではなく決定係数を用いるべきである。
ω
α
カテゴリ数
図1
=⋯=
= 0.7 の場合
ω
α
カテゴリ数
図2
場合
= 0.9、
= 0.8、
= 0.7、
= 0.6、
= 0.5 の
引用文献
岡本安晴(2013)日本テスト学会第 11 回大会発表論文抄録集
岡本安晴(2014)日本テスト学会第 12 回大会発表論文抄録集