∑ ∑

情報科学演習
簡単な統計計算
Excel
実験で得られる数値は、どんな測定においても必ず「誤差(error)」を含んでいます。たとえ
ば、ある鉛筆の長さを目分量で測ると 20 cm、定規で測ると 21.8 cm、ノギスで測ると 21.76
cm、というように、測る方法によってその誤差を減らすことはできますが、どんなに正確
な方法を使っても、誤差を完全な意味でゼロにすることは不可能です。したがって、あら
ゆる実験において数値を得る際は、誤差の正しい扱い方を知らなければなりません。
誤差は、以下の式で定義されます。
(誤差)=(測定値)-(真の値)
ここで真の値は、私たちが本当に知りたい値ですが、誤差を完全に取り除くことができな
いため、厳密な意味ではこれを得ることができません。そこで、測定値から真の値を推定
(estimate)する必要が生じます。真の値の推定値として最もよく用いられるのは「(相加)平
均値(average)」 x です。
x
 xi
N
(ここで xi は各測定値、N は測定回数)
このほかに「中央値(median)」なども用いられます。
問題
16) ある液化天然ガス中の水銀濃度を 10 回くり返し測定し、つぎの結果を得た。平均値と
中央値を求めよ。
23.3
22.5
21.9
21.5
19.9
21.3
21.7
23.8
22.6
24.7
(単位:ng mL1)

測定値のばらつきの程度を表す指標として最もよく用いられるのが、
「標準偏差(standard
deviation)」sx です。
sx 
 ( xi  x )2
N 1

これを平均値 x で割った「相対標準偏差(relative standard deviation, RSD)」も用いられます。
相対標準偏差は「変動係数(coefficient of variation, CV)」とも呼ばれます。
問題
17) 先の 10 個の測定値について、標準偏差と相対標準偏差を求めよ。ただし、相対標準偏
差の単位はパーセントで表せ。
ある測定値が何かの量に依存して変化するとき、その関係がどのようなものかを知ること
はつねに重要です。グラフ化するときは、原則として実験的に制御可能な量(実験変数)
を横軸、それぞれの実験条件における測定値を縦軸にプロットします。
問題
18) 金属ナトリウムに波長()の異なる紫外光または可視光を照射し、光電効果により放出
された電子の運動エネルギー(K)を測定したところ、以下の結果が得られた。
 / nm
100
200
300
400
500
K / eV
10.1
3.74
2.08
0.692
0.222
K をに対してプロットせよ。
実験変数と測定値との関係が、理論で予想できる場合があります。測定値のプロットに対
して理論的に計算される曲線を当てはめる(curve fitting)ことにより、特性値(parameter)を求
めることができます。ただし、測定値には誤差が含まれる一方で、理論曲線には誤差が含
まれないので、両者が完全に一致することはありません。
問題
19) Einstein の光電効果の理論によれば、K は以下の式で表される。
K = h   (ここで h は Planck 定数、は入射光の振動数、は金属の仕事関数)
先の測定値に直線を当てはめて h とが求められるよう、プロットしなおせ。
各実験変数 xi における測定値 yi と理論値 ŷi との差、すなわち yi  ŷi を、
「残差(residual)」と
呼びます。残差の二乗和が最小になるように特性値を選ぶと、どの測定値からも大きく離
れていない、もっともらしい当てはめ曲線を描くことができます。この方法を「最小二乗
法(least-square method)」と呼びます。このとき得られた曲線を「回帰曲線(regression curve)」
と呼びます。一次関数の場合、回帰直線(regression line)の傾き m と切片 b は、以下の式で表
されます。
m
 ( xi  x )( yi  y )
 ( xi  x )2
b  y  mx
(ここで x はすべての xi の平均値、 y はすべての yi の平均値)
問題
20) 上の式を用いて h とを計算せよ。つぎに「近似曲線」ツールを用いて h とを求め、
前者と一致することを確かめよ。
(必要ならば、真空中の光速 c0 = 2.998 × 108 m s1、電気素
量 e = 1.602 × 1019 C を用いよ。
)