技術文書推敲支援システムの改善

技術文書推敲支援システムの改善
テーマ:コンピュータシステムの構築
教養学部 情報科学科
指導教員:松本 章代
0857136 菅井 恵美
1
研究背景および目的
本研究室では,技術文書推敲支援システムというウェブサー
ビスが開発されている(図 1).このサービスは,学生自身に
よる校正・推敲を支援する教育システムである.現段階では
技術文書の最低限のルールを確認する機能,わかりにくい文
章や文書全体の流れを可視化する機能がある.
私は,利用者が自身の科学・技術的文章作成能力のさらな
る向上を目指し,上記で述べた機能のほかに適切な接続詞が
使われているかどうかを判断する機能を追加したいと考えて
いる.
技術文書では,文と文の論理的な,あるいは意味的な関係
が読み手にはっきりと分かるように文が継続されていなけれ
ばならない [1].しかし,適切な接続詞が使われていないと,
読者が分からなくなくなってしまう.これではせっかく作成
した技術文書がそれだけで台無しになる可能性がある.
不適切な接続詞が使われている場合に,それを指摘できる
機能があればこのサービスをよりよいものになるのではない
かと考え,この機能の追加を提案する.
図 2: 文集合体全体を可視化した例
2
システム概要
本システムは,システム自体は Linux 上で動作しており,
開発言語は Ruby,日本語の係り受け解析には CaboCha を用
いている.グラフの描画には Graphviz を使用する.
また,本システムは以下の機能が備わっている.
調査する.その特徴から,接続詞ごとに共通の法則性を見つ
け,それを満たさない接続詞の使われ方を検出する仕組みを
技術文書推敲支援システムに組み込む.
(1) 意図が伝わりにくい文の検出を行い,その文に対して文
単位の可視化を行う機能.
4
(2) 章または節単位の文集合全体のあらすじを可視化する機
能(図 2).
(1) では文の簡潔性・一義性の観点からわかりやすい文に修
正するための指針,(2) は文集合全体の論理性を向上させる
ための指針を与えることを目的とする.
不適切な接続詞を検出する機能は (2) に追加する.
図 1: 文書可視化システム
現在の進捗状況と今後の予定
まず,電子情報通信学会論文誌の論文賞受賞論文をスキャ
ナで取り込み,係り受け解析を行い,接続詞前後の文を抽出
して,コーパスを作成した.
つぎに,コーパスを分析し,まずは逆接の接続詞「しかし」
に着目した.
「しかし」の場合,接続詞を含む文かその直前の
文が否定文の意味合いとなることが多い.そこで,
「しかし」
を含む文かその直前の文に否定表現の助動詞「ない」が含ま
れる可能性が高い,という仮説を立て,収集したコーパスを
利用して検証を行った.その結果,一方の文に「ない」が存
在し,もう一方の文に「ない」が存在しない事例は約 40%で
あった.逆接とは本来,上に述べたことから予想される以外
の結果が示される関係を,あえて結びつける場合をいう.今
回の調査から必ずしも否定的な意味合いを取るものではない
ことが分かった.今後は,上記の仮説のほかに,さらに別に
法則性を見つけ,検証していく.また,接続詞「しかし」以
外にもこういった法則性がないかどうか調べていき,技術文
書推敲支援システムに取り入れられるようなプログラムを作
成していく.
参考文献
3
手法
まず技術文書における接続詞の使われ方を分析する.その
ために,情報系の論文誌に掲載された論文から接続詞を含む
文とその直前の文を大量に収集し,接続詞ごとの文の特徴を
[1] 若林敦:理工系の日本語作文トレーニング,朝倉書店
(2000).