漢字練習問題の自動作成システムの提案

漢字練習問題の自動作成システムの提案
2006 年 12 月
井戸伸彦([email protected])
■はじめに
web 検索を利用した漢字練習問題自動作成システムについて説明させて頂きます。
《要旨》①提案システムでは、学習対象となる漢字熟語を検索エンジンにて検索して使用
例を採取し、その使用例を再度検索してヒット数により一般的な表現であるか否
かを判定することで、漢字練習問題で利用する使用例を自動で作成します。
②使用例を用いた例文を検索の際に、学習者の興味を表す言葉をキーワードとし
て追加して学習者が興味を持ちやすい練習問題とすると共に、該キーワードに関
連する広告リンクを設けて、漢字練習問題のwebサイトの財政的基盤とします。
③新聞社記事データベースへの適用、および、
「脳を鍛える大人のDSトレーニン
グ」のような遊びの要素の付加に関しても提案します。
なお本資料に含まれる技術的な情報は、報告者が知的所有権を有し、特許を出願済みです。
■1.アイディア、基本的な手順
[1]漢字練習問題に利用する
使用例を探すために検索
エンジンを使います。
図中では、 打診 が学習
の対象となる漢字単語言
葉であり、これをまず検索
打診 ダシン
コンピュータ
検索エンジンによる用例抽出
開発を打診して
検索エンジンによるヒット数調査
エンジンにて検索します。
[2]得られた漢字単語の使用
例を文節として切り出し
コンピュータ
に関連した例文
を作るため。
一般的な文節と
YES 言えるだけのヒット数か?
ます。
図中では、 開発を打診し
例文検索、問題作成
て という文節が、使用例
となります。
[3]使用例が一般的なもので
あるか否かを判定するた
(下線部を漢字に直せ)
「X社が半導体センサーの開発を
ダシンしているらしいとの情報を得ていた。」
<広告リンク(コンピュータ関連)>
めに、再度検索エンジンを
用いてその使用例を検索し、ヒット数を調べます。
[4]ヒット数が基準より上回っていれば、該使用例は一般的な表現と判断します。
図中では、一般的な表現と判断された場合の流れを示しています。そうでない場合は、別
の使用例について[3]の手順から実施します。
1
[5]使用例としての文節をキーワードとして再度検索を行い、使用例を用いた例文を探しま
すが、この検索では学習者の興味分野を示す言葉をキーワードとして追加します。結果と
して、学習者の興味に沿った例文が漢字練習問題に使用されます。
図中では、学習者の興味分野である コンピュータ に関連し、一般的な表現であると
判定された 開発を打診して という文節を含む例文による漢字練習問題となっています。
[6]作成した漢字練習問題を提供するwebサイトでは、学習者の興味を示す言葉に関連し
た広告リンクを設け、該サイトの経済的基盤とします。
図中では、学習者の興味分野である コンピュータ に関連した広告リンクが設定されて
います。
漢字練習問題を提供するwebサイトは、下図のようなイメージとなります。
webブラウザ
<漢字の練習へのエントリ>
興味のある分野にチェックを入れて、[送信]をクリックしてください。
エンターテインメント
ビジネス
送 信
コンピュータ
完了
webブラウザ
設問
<漢字の練習>
次の例文中、下線部のカタカナの漢字を記しなさい。
例文
X社が半導体センサーの開発をダシンしているらしいとの情報を得ていた。
出典 http://www.x.co.jp “コンピュータ新聞”
解答欄(マウスにより手書き入力を行い、[送信]をクリックしてください)
送 信
スポンサー
5/8 まで最大6万円オフ
yyy社の高性能パソコンが特別価格!オンライン広告
限定で最大6万円台オフ(http://ad.jp.yyy.com)
格安パソコンが超おトク
随時更新の特価。会員登録でより安く。2000 円以上送料
無料のパソコン通販(http://www.zzz-p.com)
完了
2
■2.Google web API(実装実験)
Google web API とは、同名の検索サイトを運営する Google 社が提供する、web サイトの
検索インタフェースです。このサービスは、 web サービス (一般用語ではなく、XML
ベースの通信方式に基づくサービス形式)により提供されています。現在、無料のサービ
スですが、ひとつの Google アカウントにつき1000アクセス/日の制限があります。
提案するシステムは、Google web API を用いて実装することが可能です。
API
Web API
OS
検索エンジン
web
ハードウェア
報告者は、Google web API を利用した Java ベースのプロトタイププログラムを作成して
動作させ、提案システムの実装が意図のとおりに可能であることを確認しています。
今後、漢字入力システムなどの他の提案とも併せ、実用的な漢字練習問題サイトを立ち上
げる予定でいます。しかしながら、上記の Google web API の1日当たりのアクセス数の制
限のため、学習者が入力する任意の興味キーワードに対応する実装は不可であり、予め想
定したキーワードで作成した漢字練習問題を作成して蓄積し、これを提供する方法を採る
予定です。
更に本格的な実装のためには、検索エンジンを運営する企業・団体との協力が必要になり、
パートナーを募っております。
■3.校正済みの文書データベースの利用
打診 ダシン
校正済みの文書データベ
コンピュータ
ースが利用できる場合、使
用例が一般的であるかの
校正済み文書
データベース
例文検索、問題作成
判断のためのヒット数調
査の検索は必要ありませ
ん。この場合でも、学習者
が興味を持つ分野を表す
(下線部を漢字に直せ)
「X社が半導体センサーの開発を
ダシンしているらしいとの情報を得ていた。」
<広告リンク(コンピュータ関連)>
言葉をキーワードとした検索を行うことで、興味を持ちやすい練習問題作成と広告リンク
の設定とは可能となります。
校正済みの文書データベースには、新聞社の記事のデータベース等が考えられます。イン
ターネットの進展の中、新聞社の位置付けは今後ダイナミックに変わっていくことが予想
3
されます。日本の新聞社は、米国の新聞社に比べ広告収入の比率が低く、ハードコピー(=
紙ベースの新聞)販売への財政的依存度が高いと言われています。今後大きな舵きりが必
要となると思われますが、提案システムは、①新聞社には他業種が俄かに真似の出来ない
文書データベースの蓄積とこれの更新能力があること、②ハードコピーから離れてインタ
ーネット上で展開できること、③広告収入への展望が開けることから、面白い展開が図れ
るのではないかと報告者は考えています。
■4.遊びの要素の追加
ゲーム機である任天堂DSは、「脳を鍛える大人のDSトレーニング」などの大人を取り込
むソフトを備えることで、爆発的にヒットしました。テレビ番組を見ても、漢字の学習の
中に遊びの要素を見出していることが伺えます。提案システムにも、下図のような問題を
提供し、遊びの要素を追加して漢字学習の意欲を高めることが考えられます。
■おわりに
web 検索を利用した漢字練習問題自動作成システムについて提案しました。提案方法につ
いて、継続して議論して頂ける企業・団体があればご連絡を頂きたく、よろしくお願い申
し上げます。
―以上―
4