pdf (poster)

談話レベルの推敲支援のための人手修正基準�
飯田龍, 徳永健伸 (東京工業大学)�
研究背景: 談話レベルの推敲支援
人手による文章修正
修正対象
p 文章作成・推敲支援などの教育応用を指向した自然言語処理の需要 p  書くべき内容は充足していても,可読性の低い文章を生成してしまう p  中学・高校のカリキュラムに文章作成の授業が無い p  留学生が作成した日本語の文章で,主語が過剰に省略される p 談話レベルの推敲支援を目指す p  言語に関する理論的な方向性から首尾一貫性のある文章を生成 p  人手で推敲された結果を分析し,自動推敲な必要となる知見を得て, それをモデル化 問題点: 単純に専門家に修正を依頼すると,助詞や 細かい言い回しなど局所的な修正のみが行われる 修正作業
1. 
2. 
3. 
4. 
p 120記事の小論文 p  課題「小学校の授業における英語の早
期教育は必要であるか否かについて,
あなたの意見とその根拠が明確になる
ように,800字以内で論述しなさい」 p  高校生が作成 p 作業者: 日本語教師や小論添削など何らかの
形で日本語の指導に携わったことがある人材 言説構成素のラベル
人手による作業を4つの部分的な作業に分割 談話単位への分割 言説構成素へのまとめあげと並び換え 参照表現・接続表現などの局所的な修正 文章の構成に関する元文章の採点 n  文章を構成する最小単位である談話単位に分割 n  主題化された談話要素を非主題化
n 著者の主な主張,主張の主な理由,結論など,議
論的で論理的な文章を構成する談話単位の集合
にまとめあげる n 必要に応じて言説構成素の順序を入れ替える
作業の具体例
表現の局所的な修正 ⟨ 修正前 | 修正後 ⟩ ラベル 名前 説明
pro prompt
著者に提示された問題を繰り返しているだけ
tran transi+on 次の話題に移るための言い回し
the thesis
著者に提示された問題に関する立場の表明
main main idea thesisを支持する主な理由
elab elabora+onmain ideaに関する説明や考えなど
supp support
main ideaやelabora+onに関する具体例
conc conclusion 全体の要約や結論
reb rebuMal
thesisやmain ideaに反対する意見や具体例
solu solu+on
rebuMalで示された問題を解消する内容
sugg sugges+on rebuMalの解決方法を示す内容
back backgroundmain ideaなどの背景に相当する記述
配置修正の根拠をコメントとして残す
ラベル 談話単位ID修正結果
0 the (7)
⟨ ただし |⟩ 小学校における英語の早期教育 ⟨ が | は ⟩ 必要である ⟨ という |⟩。 ← 主張といえる文がこれしかないので、ここへ移動 1 main1 (5)
⟨ そのような意味では、|⟩ 中学校や高校で英語を学習して、「英語が難しい」と苦手意識を持ってしまう前に、小学校で「英語が楽しい」と思えるような教育をす
るの ⟨ が | は ⟩、むしろ必要なこと ⟨| と思う ⟩。 ← 主張を裏付ける理由をここへ移動 (6)
日本語と同様に、相手とのコミュニケーションをとる手段として早期から英語に触れていれば、後になってから苦労して学ぶという ことに ⟨| は ⟩ ならない。 2 back1 (0)
私 ⟨ が | は ⟩ 小学校中学年、高学年のときに英語に触れる機会があった。 3 elab1 (1)
それ ⟨ が | は ⟩ 中学校や高校における「英語の授業」という ⟨。| よりは、⟩ (2)
遊びの感覚で楽しめる ⟨。|⟩ (3)
ものであった。 4 supp1 (4)
例えば、英語の歌を歌ったり、朝の健康観察のときに先生と英語であいさつをしたり、英語を身近に感じることができるものであった ⟨| と思う ⟩。 5 main2 (8) 人
⟨ 前術の通り | ただし、⟩ 子どもたちが「楽しい」と思えるよう ⟨ だ。| な ⟩ (9) 手
ものでない ⟨。| と ⟩ で
(10) 配
⟨| 英語の早期教育は ⟩ 全く意味がなく、むしろ逆効果になってしまう。 6 supp2 (11) 置
私 ⟨ が | は ⟩ 幸運なことに、小学校だけでなく中学校で ⟨| も ⟩ 英語の授業が「楽しい」ものであると思うことができた。 (12) を
それ ⟨ が | は ⟩ 何よりまず、当時の ALT の先生のおかげであったかもしれない。
修
(13)
というのも、彼女と私に ⟨| は ⟩ 共通の趣味があり、よくそのことについて話したり、英語の授業で洋楽を聴いたり、英語で書かれた レシピを見ながらクッキーを
正
作ったりと、私だけでなく誰が楽しめるような時間にしてもらえた ⟨| からである ⟩。 7 reb (18)
「そんなに早くから子どもに英語を学ばせる必要 ⟨ が | は ⟩ ない」という人 ⟨ が | も ⟩ いるであろう ⟨。| が、⟩ ← 反対意見とそれについての著者の見解なので、
起承転結の「転」としてここへ移動 8 solu (19)
その早い時期に子どもが楽しんで英語に触れることができれば、それが子どもの可能性を広げるということに繋がるのではないだろうか。 9 conc (14)
英語に限ったことではない ⟨。| が、⟩
(15)
何かを学ぶということにおいて、一番大切なの ⟨ が | は ⟩、学ぶ本人がどれぐらい意欲を持 ⟨ つ。|って ⟩ 言説構成素の (16)
学べるかということである。 ラベル付与
(17)
「もっと知りたい」という意欲が何より本人の力を伸ばすのである。 rely outputs of coreference resolu1on model
作業結果の人手分析
予備実験
p 既存の首尾一貫性を推定するモデルが推敲後を検出できるか?
p 修正前と修正後で増減した言説構成素の遷移を調査 p 推敲前と推敲後の文章で談話単位が変更された70記事が対象
p  BOT(文章頭)àthe(著者の立場表明): 増加 (参考結果は新聞記事の場合)
文章の最初がいろんな書き出しではじまっていたものを,
モデル
参考結果 精度(%)
立場表明に関する記述(例: 英語早期教育に反対です)
文章内に頻出する語「英語」
ランダムベースライン 「小学校」などのキーワード
50.0
50.0
を最初に配置するように並び換え の遷移は首尾一貫性を捉え
en+ty g
rid モ
デル 70.7
25.7
p  main(主張の主な理由)àelab(詳細な説明)or supp(具
る特徴とはならない (Barzilayら, 2008)
体例):増加 à 別の観点から文章の良さ 共参照解析を用いた
76.1
38.6
を見積る必要ある p  main(主張の主な理由)àreb(反論): 減少 モデル (Iidaら, 2012)
(※ 詳細は予稿集を参照) 言語処理学会第19回年次大会 (2013/3/15)�