発表資料PDF - 学習項目解析システム

2.文法項目
文法項目の主観判定による
6段階レベルづけとその応用
• 旧『出題基準』・・・初級から上級までの文法,活用形
• グループジャマシイ(1998)『日本語文型辞典』・・・初級から上級までの
文法項目
• 国立国語研究所(1951) 『現代語の助詞・助動詞』・・・助詞,助動詞
• 森田・松木(1989) 『日本語表現文型』・・・複合辞
• 国立国語研究所(2001) 『現代語複合辞用例集』・・・複合辞
堀恵子(筑波大学 )・李在鎬(筑波大学)
砂川有里子(筑波大学)・今井新悟(筑波大学)
江田すみれ(日本女子大学 )
表1 「はごろも」文法表と先行研究との共通項目数
先行研究
出題基準
共通項目数
国研(2001)
881
国研(1951)
350
425
ジャマシイ
1468
森田・松木
549
1.「日本語文法項目用例文データベース『はごろも』」
3.意味用法,機能
日本語教師支援のため,文法項目の用例文を,話し言葉と書き言葉の
複数のコーパスから抽出し,web上で公開しようとするもの
•
•
•
•
•
•
1) 文法項目:初級〜上級,網羅的に収集。1,884項目
助詞・助動詞・接続助詞・文型「たとえ〜ても」・複合辞「〜うが,まいが」など
旧日本語能力試験出題基準(以下,旧出題基準)は,コーパス調査の結果,
低頻度の項目があると指摘されている(江田・小西2008,堀他2009,砂川他
2011他)
コミュニケーションに役立つ文法項目を
「ている」
動作作用の継続 「私は今本をよんでいます。」
結果の状態 「まどがしまっています。」
繰り返しの行為 「ここでは,過去に何度も事故が起こっている」
経験 「彼は1ヶ月前に会社を辞めている」
恒常的な状態 「道が曲がっている」
完了 「子供が大学に入るころには、父親はもう定年退職しているだろう」
5.データベースの概念図
4.利用するコーパス
2) 1つの形式に複数の意味,機能も。
「ている」 旧出題基準では「動作の継続,結果の状態」
「はごろも」文法表では,6つの用法
文章表現:
「日英新聞記事対応付けデータ
(JENAAD)」
「ブログデータ(京都大学・NTTによる)」
「白書」
「CASTEL/J」
教科書データ
口頭表現:
「日本語会話データベース」
「宇都宮大学パラ言語情報研究向け音
声対話データベース (UUDB)」
「名大会話コーパス」
「BTSによる多言語話し言葉日本語会話
1」
3) 用例:教科書,話し言葉,書き言葉のコーパスから抽出。
4) 構造化されたデータベース
コーパスを収集→データ加工→抽出された用例から意味・用法に一致する用
例を目視で精選。
したがって,文字列検索とは異なり,ゴミがない。
本研究は科学研究費補助金基盤研究(C)(課題番号:22520538,代表:堀恵
子)の援助を受けて行ったものである。
図1 「はごろも」データベースの概念図
5.文法項目の6段階レベルづけ主観判定
• 文法項目をいつ教えるか→難易度づけが必要
• 旧出題基準に代わるもの
• CEFRの6段階を参考に:日本語教育でよく行われ
ている3段階をより細かく。
「初級,中級,上級」これだけでは大まかすぎる
「初中級,中上級,超級」を加えた。
• 記号をA1からC2としたが,CEFRにとらわれることな
く,日本語教師の直感『主観』を重視して,6段階に
わける。
表2 主観判定における6段階レベル
分けの記号とレベル感
記号
A1
A2
初中級
B1
中級
B2
中上級
C1
上級
C2
超級
主観判定
• 調査協力者:日本語教育経験者7名
• 判定方法:文法項目とその機能,例文を明示
その他の情報は示さないブラインド方式で
行った。
数値を記入
1
2
3
4
• A2で旧4級:「Aくありません」「Aくありませんでした」
「Aくて」「Vないで~V」「しか」「とき」等
• B1で旧3級:敬語の類「~いたす」「Vていらっしゃる」
「Vておる」「お~する」,「Aがる/Vたがる」「ず/ず
に」「て(も)かまわない」「ようだ」等
• B2で旧3級:敬語の類「おいでくださる」「みえる」,
「Nらしい」「てまいる(丁重語)」等
• C1で旧3級:「かい(問いかけ)」
表3 6段階ごとの項目数と旧出題基準の級
A1〜C2の記
号は,今後
再考する
レベル感
初級
7.今後の課題
6.6段階レベルと旧出題基準の関連
超級
上級
中上級
中級
5 初中級
6 初級
• 調査期間:2011年12月から2012年2月1日まで
調査の結果
• 評定の一致度を示すκ統計量 は,5名の評定者の間で
0.53となり,中程度の一致が見られた 。そこで5名の評
定を採用し,その平均値をもって6段階レベルづけを行っ
た。
★κ統計量とは,「 κ統計量kappa statistic(カッパ値とも
いう)とはカテゴリーなどの名義尺度での一致性の指標」で
ある(原野「κ統計量」より)
はごろも6段階
A1
A2
B1
B2
C1
C2
4
127
54
4
総計
旧出題基準
3
2
6
59
85
67
5
243
1
82
3
185
156
1
新しい項目
22
83
195
18
326
119
321
23
41
395 160
988
総計
155
196
351
592
523
67
1884
表4 文法項目の6段階と旧出題基準の一部
文法項
見出し
目ID
意味用法
旧出題 レベ
例文
基準 ル
162 Vている
動作作用の継続
4
A1
私は今本をよんでいます。
163 Vている
結果の状態
4
A2
まどがしまっています。
道が曲がっている
166 Vている
恒常的な状態
A2
164 Vている
繰り返しの行為
B1
ここでは,過去に何度も事故が起こっている
165 Vている
経験
B1
彼は1ヶ月前に会社を辞めている
802 Vている
完了
こととなってい
決まり/習慣/予定
る
決定に基づいた
524 ことにしている
習慣
ことになってい
527
決まり/習慣/予定
る
518
B1
子供が大学に入るころには、父親はもう定
年退職しているだろう。
2
B2
授業は4月7日から始めることとなっている。
B1
毎日必ず日記を付けることにしている
2
B2
授業は4月7日から始めることになっている
文法表は,現在,コーパスの用例を目視で行って
いる。今後は,教材研究,教材作成や能力評価
の参考にされることを期待する 。
文法項目の精査:単純な誤りを修正(重複など),
• 項目はコミュニケーションに役立つか→母語話者
データ(口頭表現,文章表現)における使用頻度
• その項目を使って何が表現できるか,あるいは,
「何かを表現したいときにその形式を使わなけれ
ば言えない」か。
• 意味用法機能の項目名
6段階レベルづけの妥当性:学習者データ(口頭表
現,文章表現),学習者の外的基準との関連を調査
【参考文献】
グループジャマシイ(1998)『教師と学習者のための日本語文型辞典』くろしお出版
江田すみれ・小西円(2008)「3種類のコーパスを用いた3級4級文法項目の使用頻度調
査とその考察」『日本女子大学紀要. 文学部』 57, 28-1
国際交流基金・日本国際教育協会(2002)『日本語能力試験出題基準【改訂版】』
国立国語研究所(1951)『現代語の助詞・助動詞−用法と実例−』
国立国語研究所(2001)『現代語複合辞用例集』
砂川有里子・清水由貴子・奥川育子・千葉庄寿(2011)BCCWJによる機能語データベー
ス(スタンドアロン版)(Ver. 0.9.1b)特定領域研究「日本語コーパス」研究成果
報告書
原野悟「κ統計量」『EBMのための臨床疫学講座入門』
<http://kamiyacho.org/ebm/ce201.html>(2012年2月2日閲覧)
堀恵子・荒川みどり・小池恵己子・小林佳代子(2009)「日本語能力試験出題基準の<
機能語>を対象としたコーパス調査−目標言語使用領域での課題遂行に必
要な項目を検証する−」『2009年度日本語教育学会春季大会予稿集』
pp.194-199
森田良行・松木正恵(1989)『日本語表現文型』アルク
【コーパス】
「日英新聞記事対応付けデータ (JENAAD)」Masao Utiyama and Hitoshi Isahara. (2003)
Reliable Measures for Aligning Japanese-English News Articles and Sentences.
ACL-2003, pp. 72--79.
「ブログデータ(京都大学・NTTによる)」京都大学情報学研究科--NTTコミュニケーショ
ン科学基礎研究所 共同研究ユニットによる http://nlp.kuee.kyotou.ac.jp/kuntt/
「白書」 各省庁の白書からテキスト化
「CASTEL/J CD-ROM V1.5 」日本語教育支援システム研究会
「日本語会話データベース」平成8‐10年度文部省科学研究費補助特定領域研究「人
文科学とコンピュータ」公募研究(「日本語会話データベースの構築と談話
分析」 研究代表者 上村隆一)の成果による
「宇都宮大学 パラ言語情報研究向け音声対話データベース (UUDB)」
「名大会話コーパス」科学研究費基盤研究(B)(2)「日本語学習辞書編纂に向けた電
子化コーパス利用によるコロケーション研究」(平成13年度〜15年度、研究
代表者:大曾美惠子)
「BTSによる多言語話し言葉日本語会話1」宇佐美まゆみ監修(2005)『BTSによる多言
語話し言葉コーパスー日本語会話1』東京外国語大学大学院地域文化研究
科21世紀COEプロジェクト「言語運用を基盤とする言語情報学拠点」
パネルセッションのお知らせ「webツールを通して世界とつながる日本語教育 」
19日 9:00〜11:00 会場:パネル7 IB電子情報館1F(IB110)
登壇者:堀恵子,江田すみれ,山田ボヒネック頼子,毋育新