スタンダード・スピーキング・テスト（SST）に関わる考察と評価

スタンダード・スピーキング・テスト（SST）に関わる
考察と評価
田辺洋二
はじめに：SST を評価するにあたって
オーラルコミュニケーション研究所では、発足以来、グランドデザインの理念に則り、
「議論
ができる英語」の育成を念頭に、早稲田大学の学生の英語発信能力を高めることを目的として、
スピーキングテストの導入を策定し、その結果によっては、英語履修単位に換算することの是非
をも含めて、その内容の検討を進めてきた。そのモデルにアルク社の『スタンダード・スピーキ
ング・テスト（Standard Speaking Test: SST）』を用い、早稲田大学の英語教育向上のために、
どのように活用できるか、さまざまな角度から検討が加えられた。以下の評価は、その検討の過
程で討議された結果の報告である。
SST は実用英語技能検定試験（英検）における面接などと共に、日本における数少ないスピ
ーキングテストの一つである。しかも、長年にわたって諸外国語の学習熟達度（proficiency）を
測定してきた面談テスト Oral Proficiency Interview（OPI）から生まれたテストである。この
OPI を開発した全米外国語教育協会（ American Council on the Teaching of Foreign
Languages: ACTFL）が日本人を対象に作成し、信頼性を認定した権威あるテストである。
ACTFL OPI と SST はレベル設定、視覚教具の使用など、課題提出の方法、面接時間の設定な
どに相違はあるが、信頼性と妥当性が安定したテストとして知られる。
本研究所での考察と評価は次の手順で行われた。まず、研究所の各委員が SST の面接試験を
見学し、その面接方法、測定法、時間配分、試験官（interviewer）の態度など多角的に観察評
価し、試験官から評価官（rater）にどのようなデータが送り込まれるか検討を行った。次いで、
スピーキングテストを評価する際の一般的な諸相を検討し、それらの観点に立って SST を分析
し、考察の上、評価を試みた。項目は、大項目に（1）スピーキングテスト評価に関わる諸相
として、スピーキングテストに伴う一般的な諸相の概観、次に、
（2）SST に関する評価をあげ、
一般的な諸相に立った SST の特徴を調査分析した。その各々の項目は次の通りである。
1．スピーキングテスト評価に関わる諸相
1.1 コミュニケーション能力育成の必要性
1.2 コミュニケーションの機能性
1.3 スピーキングテストにおける正確さと流暢さ
1.4 スピーキング能力の測定と評価
1.5 スピーキングテストの信頼性と妥当性
1.6 スピーキングテストの内容と質
1.7 流暢さについて
2.
SST に関する評価
2.1 コミュニケーション能力育成の必要性
2.2 コミュニケーションの機能性
2.3 スピーキングテストにおける正確さと流暢さ
2.4 スピーキング能力の測定と評価
2.5 スピーキングテストの信頼性と妥当性
2.6 スピーキングテストの内容と質
2.7
流暢さについて
本評価においては、日本人が特に関心をもつ「流暢さ」に焦点を絞って検証を行った。ACTFL
OPI など海外のテストではコミュニケーション（情報のやりとり）と全体的な正確さがひとつ
の基準として設定され、発音の流暢さはその正確さの中に含まれる。日本人は発話表現の美しさ
に特段の関心を示すことが多い。文法的な正確さは当然の問題として取り扱われる。発話が流暢
かどうかは多くの学生にとっても興味の焦点であり、流暢さに関連するスピーキングテストの基
準のあり方を検討することは、日本人対象のテストとして調査の価値があると考えられたからで
ある。
英語の４技能、すなわち listening、speaking、reading、writing の技能の中で、speaking
の評価がもっとも難しいとされる。基準、方法、観察、測定、査定、評価などいずれをとっても
数量化が困難だからである。しかし、総合的（holistic）な評価であっても、学習者にとっては
重要な意味を持つ。英語で発信するための技能を求める声が高い現在、カリキュラムに組み込む
可能性を含めて、speaking の訓練とその評価方法を学生に提供することが重要に思われる。こ
の SST の評価が一つの突破口になれば幸いである。
スピーキングテスト評価に関わる諸相
1.1 コミュニケーション能力育成の必要性
近年、外国語（英語）教育の目標は実践的コミュニケーション能力の育成に重点が置かれ、特
に発信能力の是非が問われることが多くなった。文部科学省告示の中学校、高等学校の学習指導
要領にコミュニケーション重視の英語教育の重要性が繰り返し述べられている。平成 13 年１月
文部科学省『英語指導方法等改善の推進に関する懇談会
報告』
（pp.25, 26）においても同様で
ある。私学はその範囲外にあるとする意見もあるが、全国の４年制大学・短大のほぼ 80％∗が私
学であることを考えれば、私学の動きで日本の英語教育の方向付けができるわけで、放逐できる
問題ではない。しかも日本の英語教育全体が地球規模の国際化の渦中にあり、もはや日本国内の
問題としての域を超えている。
大学教育においてもコミュニケーション重視の教育が日々問われている。しかしながら、そ
の一方で、大学入試の傾向がいまだに従来型に頼るところがあり、それに対応する形で高等学校
の大学入試対策が行われ、コミュニケーション能力開発に欠如が起こり、結果的に発信型のコミ
ュニケーション能力を身に付けずに大学に進学する者が多くなっている。そのため、学生のコミ
ュニケーションの技能を向上させ、さらに学生のスピーキング能力育成とその学習の支援が大学
の急務になっている。本オーラル・コミュニケーション研究所がスピーキングテストの活用につ
いて検討することとなったのも、そのような経緯による。
1.2 コミュニケーションの機能性
現代の外国語（英語）教育では、コミュニケーション能力が重要視され、その教育の重点はコ
ミュニケーションに置かれる。しかしながら、L2、L3 話者の総合的なコミュニケーション能力
（communicative competence）とは、発音、語形、統語力、語の選択、表現法、発話の内容な
どの各言語伝達の要素がネーティブスピーカーと同等の能力になることを意味するものではな
い。言語としての機能性（function）が高まればよいとする。ちょうど、母語話者を native speaker
と呼び、L2、L3 として母語話者と同等に言語を駆使する人を「機能的母語話者」（functional
native speaker）と呼ぶのと同じ理由である。話し手と聞き手が意思の交換が可能になればよい
とする。
1.3 スピーキングテストにおける正確さと流暢さ
スピーキングの技能（skill）には、文を正確に構成し発話する能力すなわち正確さ（accuracy）
と、滑らかな話しぶりを感じさせる能力、すなわち流暢さ（fluency）が必要とされる。前者に
ついては、「正確さ」と一言で言っても、内容は、発音、語形、統語力、語の選択、表現法、発
話の内容に関わる正確さが要求され、その範囲はきわめて多岐にわたる。スピーキングの技能が
高いと感じさせるのは、それらの総合的な技能が高いことを意味し、そのいずれかが欠けても、
∗
私立４年制大学
私立短期大学
457 大学（全 622 大学）
：73.5％
503 短大（全 585 短大）
：86.0％
合計 960 大学（1207 大学）
：79.5％
（数値は 2000 年度）
技能がきわめて高いという印象を与えない。しかも、その評価には当然のこととして、一般的な
ネーティブスピーカーの発話が基準になっている。
後者の「流暢さ」については、単に発話の速さだけの問題ではなく、
「正確さ」によっても「流
暢さ」を感じさせることは十分にできる。この評価にもネーティブスピーカーの発話が基準とな
っている。しかし、ネーティブスピーカーの正確さと流暢さと言っても千差万別である。正確さ
に関する直感は生得的にもってはいるが、個人的には雄弁な人、訥弁な人、話し上手、話し下手
など様々である。そのネーティブ性を客観化するのは、流暢さとは別の問題であろう。またその
一方で、ネーティブの持つ言語性には L2、L3 話者にはない母語性としての基準があることも理
解できる。機能面から見た場合、L2、L3 の話者にも母語話者と遜色のない人がいることも確か
である。その判断には、その判断をする者の主観が伴うのが常である。正確さは比較的容易に観
察され計量化できるが、流暢さは、1.7 に詳述するように、かなり測定困難な特徴を持つ。流暢
さの客観化はその要素の多様さから、発音や文法、そして表現力など正確さの中に含めて観察す
ることが一つの可能性になるかもしれない。
1.4 スピーキング能力の測定と評価
スピーキング能力を測定するとき、何を測定すべきなのか。何を基準とすべきなのか。その測
定されたものをどのように評価するのか。その評価とは、個人のコミュニケーション能力の査定
（assessment）なのか。このような疑問は、発話能力の評価には常にまつわる問題で、これに
対する理論性と実践性を兼ね備えた唯一の解答はいまだにないと言ってよい。その理由は、リス
ニングやリーディングと異なり、スピーキングの場合は、個人の意思の交換だけではなく、個人
の性格、話す速さ、声の質など多岐にわたる数値化できない要素が含まれているからである。し
かしながら、英語を適切に使う能力の程度（proficiency）を測る実践的な測定検査は ACTFL OPI
の他にも数種ある（Riggenbach and Lazaraton: 133）
。ACTFL OPI に基礎を置くアルクのスタ
ンダード・スピーキング・テスト（SST）はその有力な一つである。
スピーキングは口頭による意思の伝達だが、その学習・指導法は多様である。例えば、コミ
ュニケーションならば身振りでも可能であり、コミュニケーション能力（communicative
competence）を重視する教育では、特に初期の段階で、発音、語形、統語力、語の選択、表現
法といった各項目の正確さを求める意識的な学習を勧めない場合すらある。その論拠は、L2、
L3 の学習者には学習しようとする意欲が正確さに対する意識で阻害され、感情的な障壁を作る
からだと言う。その上、コミュニケーション能力の評価とは総合的な（global, holistic）評価で
あり、構造主義哲学の産物である発音、語形、統語力、語の選択、表現法といった評価細目に関
する数値的な評価を使うのは、認知主義的・生成論的な能力の評価とは矛盾するとの考え方もあ
る。
しかし、スピーキングテストはあくまでも外国語（英語）の熟達度（proficiency）を総合的
に判断し、実用性の高いものであって、理論的整合性を完全に持たねばならないといった性格の
ものでもない。それ故に、理論的整合性がないという理由だけで、このテストが印象的で主観的
なテストであり、無効であるとは言えない。これらの問題は長年にわたる経験の積み上げ、連続
した調査・研究、試験官（interviewer）に対する質問技法などの教育と、試験官と評価官（rater）
との区別など、評価の印象性と主観性をできるかぎり除去する手段が採られているからである。
1.5 スピーキングテストの信頼性と妥当性
テストの信頼性と妥当性については、
『英語教育大辞典』に次のようにある。
「妥当なテストと
は、そのテストが測定しようとしている特性に関して受験者の得点がその人の能力を忠実に反映
しているテストのことである。テスト作成者は、妥当性を検証するために、一般に実証的手法と
統計的手法を組み合わせて用いる」。また信頼性については、
「テスト作成者は、複数の技能分野
について広くサンプルを採取し、同一の問題を繰り返し出題して比較することによって内的な一
貫性を測り、さらに、採点者間で採点基準についての見解の一致を調べることにより、テストの
信頼性を検証しようとする」（『外国語教育学大辞典』: 249-250）とある。スピーキングテスト
の妥当性に関しても、実証的な手法と統計的な手法を組み合わせて行うが、上に述べた測定と評
価に関わる問題、及び次に述べる内容と質の条件が関わるため、これまでの研究や調査結果、ま
た経験的で実証的な要素を完全に排除して行うことは不可能である。テストの信頼性は妥当性の
高まりによっても上がる。
1.6 スピーキングテストの内容と質
スピーキングテストには上記の課題が残るのではあるが、一般的には、次のような内容を伴う
のが妥当とされる。それは、文法的な正確さに加えて、会話に社会文化的な観点からみた適切さ、
対話のあり方、対話の作り方などが自然であるかどうかを観察すること。すなわち、自然である
ことは適切さが高いことを意味する。コミュニケーション能力の要素としては、（1）文法的・
言語的能力、
（2）社会文化的能力、
（3）対話構成能力、それに（4）方略的能力があるので、話
し手の活動、すなわち話す過程の中で、それらの要素が如何に自然に組み込まれているかが測定
できるような内容にすることが必要とされるのである。
H. Riggenbach and A. Lazaraton は、以上の観点から、ACTFL OPI を主として学生の文法
能力の正確さの観点から評価するテストであるとした（Riggenbach and Lazaraton: 133）。こ
の２人の研究者による結果も、コミュニケーション能力を上記のように細分するところから得る
結果であろう。彼らは ACTFL OPI よりもさらに communicative な測定を行うことを検討し、
1987 年に自らが行った特定のコースでのテストの結果によって自らの方法を次のように記した。
それは特定の目的を持ち、タスク形式を基本形式とし、受験者に意見を言わせ、比較対照や物語
作りをさせ、ものの記述説明を課し、発話過程を観察の上、質疑応答などを行い、より総合的な
アプローチを行い、学習者の機能的能力（functional ability）を確かめるようにしたものだとい
う。同時に、流暢さ、発音、文法、語彙を調査し、さらに学習者がいかに外国語を制御し使い切
っているかを調べるために、部分的な細目の正確さよりも「コミュニケーションの全体的な能力」
（communicability）の測定に意を用いたとしている。興味深いのは、この方法と SST の手法
との類似性である。
スピーキング技能の評価基準（ガイドライン: Guidelines）について、North は、基準は基本
的実用的な道具であり、次のような利点があるとする。（1）主観的に行われた評価とは言って
も、適切な基準を設定することによってその信頼性を高める。基準によって共通の標準ができる
からである。（2）基準があれば、テストの構造が決まる。（3）さまざまな検査機関や人による
査定評価からの結果を共通の基準によって報告することができる。（4）基準が同じなので使用
した機関内での諸テストについて関連性の高い処理ができる。
（5）ACTFL OPI のように、他言
語との相関を調べるための共通の尺度を持つことができる。（6）どのような教育環境において
も、どのように多種の関連機関が使用しても、共通の基準によるフレームを持ち、お互いに参照
しあうことができる。さて、ACTFL OPI の構造と高い関連性を持つ SST の内容と質はどうか
という問題になる。
1.7 流暢さについて
日本人はスピーキングと言えば、なんと言っても、その流暢さ、滑らかさに大きい関心を持っ
ている。もちろん正確さを重視するのではあるが、たとえ正確な話し方をする人の場合でも、流
暢さがなければ「話し方が上手だ」とは言わないことがある。逆に、滑らかな話し方を耳にする
と、多少の正確さを度外視しても、
「話し方が上手だ」と言う。このように聞き手の美意識や音
感に訴える話し方に興味を持つので、流暢さには特段の注意が必要になる。そこで、ここでは流
暢さ（fluency）について記述する。
スピーキングテストはさまざまな発話構成要素を基礎に、受験者の全体的な熟達度
（proficiency）を測定し、同時に評価をする道具である。熟達度を示す発話の要素に「流暢さ」
がある。しかし、この流暢さは正確さ（accuracy）と共に話題には登るが、その内容が発話の
速さ（rate）からポーズ（pause）、さらに話す態度（behavior）など多種多様な要素からなる
上に、その要素同士の間で醸成される効果もあり、測定不可能な感じさえする。しかし、発話に
は流暢さが存在することは明白であり、その特徴については、次の諸説がある。
Lazaraton は前掲書の新版において、流暢さを現在話題の中心である focus on meaning にポ
イントをおいて検証する。口頭による技能を教える場合には、正確さと流暢さのバランスをよく
取るように注意すべきだとする。ついで、流暢さの測定評価には次の２点を勘案することを勧め
ている。これは Hedge（1993: 275-276）によるもので、（1）これまでの流暢さと同じ意味で、
スピーチを形成する要素を滑らかにつなぎ合わせ、無理なく、あるいは不適当な遅さや不用な躊
躇がなく発信できること。
（2）さらに総合的な流暢さであり、自然な言語使用に関わる特徴で、
例えばビジネスでの交渉などで見られるように、内容中心に話を進める場合にできるものである。
そこではスピーキングの方略が発生するので、あきらかな訂正が最小限に抑えられることである。
これは最近の理論趨勢が focus on form から focus on meaning に移ってきていることによる
（Lazaraton, 2001: 103-105）。
R. Ellis は L2 の学習計画と技能習得を進める過程で、流暢さには時間的な変数（temporal
variables）と躊躇現象（hesitation phenomena）が関わり、測定にはこれら２つの基本的な要
素を調べる必要があるとした（Ellis: 393-394）。
W. O’Grady と J. Archibald は流暢さを「第二言語を自動的に、しかも明らかな躊躇もなく発
話できる能力」と定義した。さらに、第二言語学習者がその熟達度を示すには、正確さと流暢さ
を示すことが必要であり、正確さは学習者の知識の量によること。そして、流暢さには敏速に発
言を修正したり表現を組み立てたりする技能（skill）が必要なことを述べ、発話認識の重要な要
素としている。そして、それには個人差があることにも触れた（O’Grady and Archibald: 616,
433）。
Richards, et al.は、第二言語習得においては、書記と口頭の流暢さ（fluency）はコミュニケ
ーションにおける熟達度のレベルを示すものと明言し、次の４項目をあげた。（1）書記または
口頭の言語を容易に発することができる能力であること。
（2）よく話せる能力のことを指すが、
イントネーション、語彙、文法は完璧である必要はない。（3）効果的に意思を伝えることがで
きる能力であること。（4）継続して発話を繰り出せる能力で、理解に困難を伴わず、コミュニ
ケーションが途絶えることもないこと。この途絶える結果をまねく話し方は fluent に対し、
dysfluent と呼ぶ。ついで、流暢さは正確さと対象的に取り扱われるが、正確さとは、文法的に
正しい文を作り出す能力であり、流暢に話したり書いたりする能力は含まないかもしれない、と
明言している（Richards, Platt, and Platt: 141-142）。
Laver は流暢さをポーズの観点から考察する。ポーズにも完全に空白のポーズと、声を出しな
がら空けるものとがある。いずれも発話中の一瞬のためらい・躊躇（hesitation）が作り出すた
めで、そのポーズがあるからと言って流暢ではないとは言い切れない。躊躇とは話し手が次に言
うべき言葉を決定できないときに生まれる結果であり、言葉を用意するときに必要とするもので
ある（Laver: 535）。流暢さの判定の難しさはこのへんにもある。落ち着きのある人のゆっくり
した発話、哲学者が思考しつつ語る思慮深い話しぶり、落ち度のないように言葉を選びながら話
す政治家のスピーチなど、すべて流暢であるかもしれないが、決して即決的な速い話しぶりでは
ない。すなわち、流暢さは話す人物と話す内容に深く関わるのである。
スピーキングテストにタスク（task）を用いることは、近年、特に注目されるところであるが、
Skehan は task-based performance を評価する際の流暢さについて、ポーズとためらいに異な
るレベルを組み込んで表現しようとする。現在では、教授法にはコミュニカティブ・アプローチ
が最良とされ、その意味で task-based による教授法（task-based language teaching: TBLT）
が高い評価を得ている。しかも、fluency に hesitation と pause が含まれることが証明されてい
るので、Skehan はこれら全てを取り込んで定義付けを行っている。特記すべきは、performance
assessment scale として流暢さ（fluency）
、文法的な正確さ（grammatical accuracy）、それに
一般的な話の内容（general range）の３分野をあげ、流暢さは他の２点にも関わること、そし
て、スピーキング能力の測定には各要素ごとで測定するのが好ましいとして、流暢さが前面に押
し出されていることである（Skehan: 177-178）。
Garman は逆に、流暢さを非流暢さ（non-fluency, disfluency, dysfluency）を作り出す要素の
割り出しからその考察を進めている。非流暢さの要素を、流暢さを測定するための証拠に使う
（p.126）。測定可能な非流暢さの要素には、空き間（breaks）、声を出して空き間を埋める（filler）
、
つなぎ（juncture）、息の吸い込み・吹き出し（inhalation/exhalation）、休息（pause）、息継
ぎ（breath pause）などがある。また、語を言い換えたり、文を立て直したり、さまざまな現
象を作り出す。この非流暢さの取り方は言語文化によっても異なるし国別によっても異なるとす
る。個人的にも違うし、場所や仕事、課題によっても異なると記す。
Goldman-Eisler（1956）の研究によると、ポーズの習慣にはタスク差（task variation）が
強く作用すると言う。これまでは個人差が強いと言われたが、タスク差はそれ以上であるとする。
すなわち、音読はスピーチより流暢さがあり、準備されたスピーチは即席のスピーチより流暢さ
があり、また、即席のスピーチは中身を意識した慎重なスピーチより流暢さがあると報告してい
る。数値的には、タスクの違いによって全ポーズ時間に対する比率が変わる。面接形式では４％
から 54％、討論形式では 13-63％、絵の説明には 16-62％、重要なスピーチになると 35-67％が
ポーズを取ったという（pp.126-127）。
さらに、非流暢さをもたらすものとして、速度（rate）がある。Butcher はポーズが次のよう
な条件にあると、流暢さが認められるとしている。（1）ほとんどの空き間（breaks）が音声連
続・文法連続の境界にあること。（2）その隙間が少なく、短いこと。（3）息を吸う場合は、長
い空き間で、息を吸う。話のテンポが速まると当然ポーズは少なくなる（Garman: 129-130）。
その他、文法の正確さがもたらす流暢さの問題を提起し、流暢さがあり文法的（ fluent
grammaticality）であるのに対し、流暢さはないが文法的（non-fluent grammaticality）
、すな
わち休止、繰り返し、語単位の発話、少数の語の固まりが多くある発話をあげる。また、流暢さ
はあるのだが非文法的（fluent non-grammaticality）な発話として、継続性のない構成、文構
造の変化をあげ、流暢な感じを与えながら、実は正確さを欠く問題を指摘している（Garman:
133-134）。以上は、非流暢さに基づくポーズやためらいは時間的に計量できるので、その点有
利な特徴であると言えよう。
Kilborn はネーティブスピーカーが持つ流暢さを感じ取る本能的な感覚について述べる。流暢
さとは、上記のとおり、その標準はネーティブスピーカーに属するものである。L2、L3 の学習
者の求める流暢さとは、結局「ネーティブスピーカーのような流暢さ」ということになる。国際
語としての英語（English as an international language）
、世界の英語達（World Englishes）
、
地球語としての英語（English as a global language）などという英語が取りざたされる現在で
あるが、その流暢さを論ずるときには、Kilborn の述べるように、やはりネーティブスピーカー
の自然な発話がモデルになるのである（Kilborn: 917-944）。これらの国際語としての諸英語は
ネーティブスピーカーの英語ではないが、機能的ネーティブスピーカーの英語と言われ、自立性
（identity）のつよい英語であるが、そこにどのような流暢さを持ち込むかは今後の重要な課題
である。
以上のように、流暢さ（fluency）は多様な特質を持つ要素で、スピーキングテストには必ず
関与する特徴であるが、質的に計量するのは困難な面を持つ特徴なのである。
2.
SST に関する評価
2.1 コミュニケーション能力育成の必要性
外国語（英語）教育の目標の重点が実践的コミュニケーション能力の育成に置かれ、発信能力
の是非が問われる現在、適切な発信能力を測定・評価するスピーキングテストの必要性が高まっ
ている。その点、もし早稲田大学で SST を活用し、その利点を活用するようになれば、画期的
な展開をみることになろう。わが国では、実用英語技能検定（英検）がスピーキングテストとし
て中心的な役割を果たしてきたが、SST はその測定と評価の仕組みから、コミュニケーション
能力に重点をおいたテストとして、今後はさらに注目されるであろう。しかし、大学のカリキュ
ラムの中で使用するとなると、実践的英語教育とは別の問題が生じ、短兵急に決することはでき
ない。
スピーキングテストをカリキュラム内に設定するには、そのための科目間の調整を始め、設
定のための確固たる理由がなくてならない。スピーキングテストの有無が学生の動機を喚起し、
積極的な学習を呼び起こすことになるかもしれないが、それを単位に換算するか否かは別問題で
ある。単に外部試験として参考点扱いすることで事は足りるからだ。
しかしながら、大学の採択の可否によって、SST 自体の価値が下がるものでは決してない。
むしろ、大学の履修教科から分離した形で活用することにより、十分な価値が生じるものと確信
する。たとえば、オープンカレッジ（エクステンション・センター）で一般に SST を提供し、
その形態で学生にも広く SST を受けさせ、スピーキング能力の測定・評価を受け、自己研鑽の
糧とすることは十分に実施可能であり、有意義なことでもある。また、オープン教育センターの
語学部門に外部試験担当の委員会を置き、TOEFL、TOEIC、英検などの外部テストを広く扱い、
発信能力測定に関わる部分で希望者に SST を受験する機会を与えるのがよい。また、オープン
教育センターでの Tutorial English 履修者や早稲田大学インターナショナルでの Tutorial
Lesson 受講者に対し、コース終了時に SST を受けさせるのもよい。このような経験的なデータ
の積み上げは、受験生の目標を作るのと同時に、SST 自体にとっても意義のあることであろう。
このようなデータの積み上げにより、将来、学部カリキュラムへの導入の可能性も出てくるに違
いない。
2.2 コミュニケーションの機能性
現代の外国語（英語）教育では、実践的コミュニケーション能力が重要視され、その教育の重
点はコミュニケーションに置かれる。コミュニケーションが円滑に行われるには、ことばの機能
性が高くなくてはならない。SST では受験者の英語の機能性を、テキストの型、内容・脈絡、
正確さ、言語機能の基準から総合的に測定し査定評価することを主目的としているので、機能性
測定の条件は十分に考慮されている。
2.3 スピーキングテストにおける正確さと流暢さ
スピーキングの技能（skill）には、文を正確に構成する能力すなわち正確さ（accuracy）と、
滑らかに話す能力、すなわち流暢さ（fluency）が必要とされる。
「正確さ」とは、発音、語形、
統語力、語の選択、表現法、発話の内容に関わる正確さであり、「流暢さ」とはその滑らかさを
評価対象とする。共にネーティブスピーカーの発話が基準となっている。しかし、ネーティブス
ピーカーの正確さと流暢さが多様であることはすでに述べた。
SST では、各レベルに文法上の正確さ（grammatical accuracy）及び流暢さ（fluency）を置
く。評価官（rater）は総合的なタスクと機能、内容・脈絡、正確さ、テキストの型について査
定評価を行うが、「流暢さ」はこの正確さ（accuracy）に含まれている。正確さには（1）文法
的な正確さ、（2）語彙の選択、（3）発音、（4）流暢さ、（5）社会言語学的な適切さが評価基準
となる。流暢さについては、1.7 で述べたように、さまざまな調査や研究があり、多岐にわたる
要素が含まれる。SST においては、試験官レベルでは流暢さ（fluency）と話し方（delivery）
で各レベル別の目安を作るが、評価官レベルでは流暢さを正確さの中に含めることで評価を行う。
これは一つの卓見である可能性がある。流暢さとは個人差とタスク差が強く出て、感情にも支配
される特徴であるため、ある人の非流暢さは別の人の流暢さになり得るし、その逆も成り立つ。
評価官レベルで流暢さを正確さに含めて評価することは、日本人対象に考案された SST の一つ
の画期的な特徴であると言えよう。
2.4 スピーキング能力の測定と評価
スピーキングの場合は、リスニングやリーディングとは異なり、個人の意思の交換だけでは
なく、個人の性格、話す速さ、声の質、話の内容とタスクなど多岐にわたる要素が関わり、数値
化できない場合が多い。しかしながら、英語を適切に使う能力の程度（proficiency）を測る実践
的な測定検査はすでに実践されており、その意味で SST はその有力な一つであると言える。
Oral Proficiency Interview（OPI）を開発した全米外国語教育協会（American Council on the
Teaching of Foreign Languages: ACTFL）は、SST を生みだした権威あるスピーキング能力測
定検査法で、listening、speaking、reading、writing について、語彙、文法などの学習度を検
査し、個人の能力を査定はするが、コミュニケーション能力と各評価項目とのあり方の理論的な
矛盾はかならずしも解決されているとは言えない。しかし、理論性と実用性の整合性はともかく、
ACTFL OPI や SST が基準（Guidelines）を用いた実用性に富んだテストであることは十分に
評価できる。
SST は ACTFL OPI と子と親の関係にあり、その検査方法には多少の異なりがあるが、特に
日本人のために考案された画期的なテストであることには異論がなく、今後さらに使用を続け、
経験的にデータを積んだ暁には、客観性の高いテストとして確立できるであろう。
2.5 スピーキングテストの信頼性と妥当性
SST の妥当性が高いことは、すでに証明済みである。実証的には ACTFL OPI との試験方法
に若干の相違はあるが、理論的には同種の試験とみて問題はなく、親試験である ACTFL OPI
の妥当性はすでに確立済みであることから、その関連において実証されているといってよい。統
計的な手法としては、非公式ではあるが、内部的に Dandonoli and Henning（1990）の換算表
を用いた ACTFL OPI 評価と SST 評価の関連性調査が行われており、その関連性は .87 の高さ
であった。この高さは調査前に予想されていたといってよい。
テストの信頼性は、その内容と質に関わる。SST は実践的に活動を行っている状況から測定
（measurement）と査定評価（assessment）の両方ができるように作成されたテストなので、
テストを作成した段階では、その信頼性を云々するのは実際問題として不可能である。確実な信
頼性を保障するのは、基準（ガイドライン）が目的別に細分化されていること、試験官
（interviewer）と評価官（rater）が区別されていて、しかも、これまでの調査と研究によって
両者の評価結果の齟齬が著しく少ないこと、視覚と聴覚を刺激するタスクを用いた課題によって
コミュニケーションを重視したテストであることなど、従来の文法的な正確さと熟達度のみに重
点を置いたスピーキングテストとは、質的に異なるスピーキングテストとして信頼性を確保して
いる。信頼性として SST に必要なのは、今後さらに活用を続け、経験的な情報を加え、実践性
を重視するテストとして信頼性をさらに高めることであろう。
2.6 スピーキングテストの内容と質
Riggenbach and Lazaraton は ACTFL OPI を、主として文法能力の正確さを評価するテスト
だとしたことは 1.6 で述べた通りであるが（Riggenbach and Lazaraton: 133）
、興味深いこと
は、彼らの改訂した結果が SST の形態によく似ていることである。
彼らは ACTFL OPI よりもさらに communicative な測定を行うことを目標に、自らの方法を
改訂し、特定の目的を持ち、タスク形式を基本形式とし、学習者に意見を言わせ、比較対照、物
語作りを行い、ものの記述説明を課し、発話過程を観察したうえで、質疑応答などを行い、より
総合的なアプローチを行い、学習者の機能的能力（functional ability）を確かめられるようにし
た。また、部分的な分野の正確さよりも「コミュニケーションの全体的な能力」
（communicability）の測定に意を用いたのである。いくつかのガイドラインに則った ACTFL
OPI テストの方式を、新しい知見と検証によって改良した SST であるが、Riggenbach and
Lazaraton の改訂と類似の結果になったことは特記すべきであろう。
SST では測定（measurement）と査定評価（assessment）を同時に行うことが期待されてい
る。しかし、査定評価には適さないのではないかという疑問も考えられる。能力の測定とはどの
程度出来るかを探ることであり、査定評価とはどのように効果的に行ったかを記述することであ
る。要するに、どの程度できるかは、ベンチマークなどによって指摘できるが、その程度の高さ
を的確に指摘できないのではないか、という意味である。Bachman は
次のように言う（Bachman 1990: 18）。
Measurement in the social sciences is the process of quantifying the characteristics of
persons according to explicit procedures and rules.
「社会科学での測定は過程である。すなわち、分かりやすい手続きと規則に従って、個人
個人の特徴を計量化する過程である」
測定は確かに過程である。しかし、過程は質を落とすものではない。測定は全体に共有する
基準の設定によって、定型化された計量値として観察することができる。そして、それは査定評
価の道具となり得るはずである。
ACTFL OPI に基礎をおく SST には、このテストを特徴づける試験官（interviewer）と評価
官（rater）のための基準（Guidelines）がある。SST はこの簡潔で効果的な基準によって特徴
付けられ、この特徴と共に、制限時間内の測定と評価によっても信頼性と妥当性を高めている。
試験官には、（1）目標、（2）試験時間、（3）話し方、（4）段階などの構成に関する基準をはじ
め、試験の運営方法、発話の引き出し方、ロールプレイのやり方などに関する基準がある。他方
の評価官には、その過程を客観的に観察して、総合的な能力、内容、発話の正確さなどによる項
目別の評価、それらを総合して判断する採点、また採点に関わる問題点の処理にいたるまでの基
準が設けられている。また、基準を立てることによって、ACTFL OPI の構造と高い関連性を持
つ SST は、さらにその質的な信頼性を高める形になっている。
2.7 流暢さについて
流暢さ（fluency）は正確さ（accuracy）と共に発信性に深く関わる要素であるが、その内容
が発話の速さ（rate）からポーズ（pause）、さらに話す態度など多種多様なため、評価が印象
的に流れやすいことが指摘されている。SST では、前述のとおり、各レベルに文法上の正確さ
（grammatical accuracy）及び流暢さ（fluency）を置く。その基準に則り、試験官レベルでは
流暢さ（fluency）と話し方（delivery）によって各レベル別での測定の目安を作るが、評価官
レベルでは流暢さを正確さの中に含めることで評価を行う。
流暢さは、単に発信時の滑らかさだけではなく、ディスカッションや問題の交渉などの場面で
は、意思伝達の表現方法に関わる要素となる。そのため、目的によっては、ポーズやためらいま
でを含めて、人格に直接関わる重要な技能として査定評価することが求められる。また、逆に、
一般的なコミュニケーションの技能としては、正確に意思が伝わることはある種の流暢さを保っ
ている証拠なので、正確さに含めることが好ましいとも考えられる。いずれにせよ、テストの目
的に照らして決定すべき問題である。現在の SST が日本人対象のテストであることを考えれば、
現状の仕組みが実際的であると思われるが、今後、評価基準にさらに検討を加える必要もあろう。
3.
まとめ
SST はスピーキングテストとしての信頼性が高く、スピーキング能力の測定と評価のための
道具として推薦し得る高い質を持つ。妥当性は ACTFL OPI との相関が強く、今後さらに経験
的な積み上げを行うことで、信頼性をさらに高めるであろう。
オーラル・コミュニケーション研究所は、大学あるいは大学の付属機関での SST 実施につい
て検討してきたが、結論として、オープンカレッジ（エクステンション・センター）などの大学
付属機関で実施し、広く社会に受験を勧め、実践データの積み上げを行うのが、現時点での最良
の方策であるとの結論に達した。その行程で早稲田大学の学生にも SST 受験を勧めれば、教育
的効果をあげることができるであろう。
学内においても、オープン教育センターでの授業活動を検証する目的等に、TOEFL、TOEIC、
実用英語技能検定（英検）などと同じように、一般外部テストとして SST を導入することも可
能に思われる。SST は発信能力テストとして用いることができるであろう。これらのテストは、
社会からの要請で、参考資料として成績表などに記入される機会が来る可能性があり、将来の構
想として念頭におく必要があろう。しかし、学内カリキュラムに直接そのまま単位として使用す
るには、さらに実践的で経験的なデータの積み上げと社会一般や学生のフィードバックと評価が
必要であるとの結論であった。
【参考文献】
Bachman, L. F. (1990) Fundamental Considerations in Language Testing, Oxford University
Press.
Dandonoli, P., & Henning, G. (1990) An Investigation of the Construct Validity of the ACTFL
Proficiency Guidelines and Oral Interview Procedure. Foreign Language Annals, 23,
11-22.
Ellis, R. (1994) The Study of Second Language Acquisition, Oxford University Press.
Garman, M. (1990) Psycholinguistics, Cambridge University Press.
Hedge, T. (1993) Key Concepts in ELT: Fluency, ELT Journal, 47.
ジョンソン, K・H.ジョンソン編（1998）岡秀夫監訳『外国語教育学大辞典』大修館書店。
Kilborn, K. (1994) Learning a language late: Second Language Acquisition in Adults. In M.
Germsbacher., & A, Morton (Eds.), Handbook of Psycholinguistics. Academic Press.
Laver, J. (1994) Principles of Phonetics, Cambridge University Press.
Lazaraton, A. (2001) Teaching Oral Skills. In M. Celce-Murcia (Ed.), Teaching English as a
Second or Foreign Language (3rd ed), Heinle & Heinle Publishers.
North, B. (1993) The Development of Descriptors on Scales of Language Proficiency. The
National Foreign Language Center.
O’Grady, W. and J. Archibald (2000) Contemporary Linguistic Analysis: An Introduction, 4th
Edition, Addison Wesley Longman.
Richards, J.C., J. Platt, and H.Platt (1992) Longman Dictionary of Language Teaching and
Applied Linguistics (2nd edition), Longman: Fluency.
Riggenbach, H. and A. Lazaraton (1991) Promoting Oral Communication Skills, M.
Celce-Murcia (1991) Teaching English as a Second or Foreign Language, Second Edition,
Newbury House.
Skehan, P. (1998) A Cognitive Approach to Language Learning, Oxford University Press.

Download Report