日本ソフトウェア科学会第 20 回大会(2003 年度)論文集 1 携帯電話におけるメール閲覧のための内容簡略化手法 Contents Simplification for Reading Mails on Cellular Phones 平岡佑介 † , 長谷川友治 †† , 保知良暢 †† , 伊藤孝行 †† , 新谷虎松 †† Yusuke Hiraoka, Hasegawa Tomoharu, Yoshinobu Bochi, Takayuki Ito, Toramatsu Shintani † † 名古屋工業大学 知能情報システム学科 †† 名古屋工業大学大学院 Dept. of Intelligence and Computer Science, Nagoya Institute of Technology †† Graduate School of Engineering, Nagoya Institute of Technology [email protected] 携帯電話に転送されてきたメールは,パソコン向けのメールの改行や記号,セパレータのつもりの記号列 の付加が,見づらくなる要因となるため,その場で読むのに適さない.さらに携帯電話のディスプレイは小 さいため,長いメールを読むことは,パソコンでそれを読むことに比べ労力を要する.そこで,本研究では 一目で読むべきメールか否かを判断できるように,転送メール閲覧システムを試作した.携帯電話にはメー ルが今読むべきかの判別を行うための要約を与える.ユーザは本要約を見て,原文を読む必要があると判断 した時,携帯電話を用いて原文にアクセスすることができる.その際,原文にも携帯電話のディスプレイを 考慮した表示処理を施す.本手法により,携帯電話でのメール閲覧に要する労力が軽減される. 1 はじめに スプレイでのコンテンツの表示に関する研究として, PowerBrower[?] では携帯端末での WWW ブラウジ ングを効率的に行うため,Web ページを意味的なま 転送して閲覧している人が多い.しかし,パソコン とまり(段落やリストなど)に分割し,意味的まと 向けのメールはディスクトップでの表示を前提に書 まりごとの要約をリスト表示する.ユーザは要約の かれており,携帯電話の小さいディスプレイでの表 リストを見て,詳しく読みたいと判断した要約を選 示に適さない. 択することで,詳しい内容にアクセスする.といっ そこで,本研究では転送メールの閲覧を支援する た,Web ページの漸進的表示を特徴としている.本 システムを試作した.本システムでは新規メールを, 研究ではこれに対し,メールを指定サイズに要約し, メール全体を把握でき,ユーザがメール全文を読む 全文を読むか読まないかの判断をするため単語の排 か読まないか判断する際に参考にする要約にまとめ, 他性,メール内での位置に注目した要約を行い,全 携帯電話に転送する.できるだけメール全体を把握 文をあたかもディスクトップで読んでいるように表 しやすくするため,文の位置と相互の文の類似度を 示する拡大・縮小表示を特徴とする. 利用して要約を生成する.また,全文にアクセスする 本稿では,試作したシステムの概要を述べ,携帯 際,その表示を携帯電話の小さいディスプレイでも 電話に送信する要約生成の手法,および携帯電話で 読みやすいよう,メール全体を把握しやすい縮小表 の長文メール閲覧時の表示方法を提案する. 示と,文の詳細を読むための拡大表示を相互に切り 替えることのできるメール閲覧用の Java アプリケー システム構成 ションを作成した.また,Java に対応していない携 2 図??に試作したシステムの概要を示す.システム 帯電話では全文を WWW にて閲覧する,そのため に,元のメール文章を携帯電話のディスプレイで読 は新規メールの本文を指定サイズに要約し,携帯電 話に転送する.指定サイズとはユーザが指定できる みやすいように整形するシステムも試作した. 既存のメール要約には人手で作成した「…のお知 要約の文字数,またはバイト数で,サイズを全角 120 らせです. 」といった,特徴表現とのパターンマッチ 文字と指定すれば,携帯電話には全角 120 文字まで によってメールの意図を推定する手法や, 「いつもお に切り詰めた要約が転送される.同時に元のメール 世話になっております。」のような不要な文を削除す 文章を WWW サーバにアップロードする.その際, ることによる要約手法がある.携帯電話の小さいディ Java での閲覧用として 4.1 節に示すタグ付けを行っ 移動中など,パソコン向けのメールを携帯電話に 日本ソフトウェア科学会第 20 回大会(2003 年度)論文集 2 図 1: システムの概要 た全文をアップロードし,WWW での閲覧用として 携帯電話の WWW ブラウザでの表示に合わせ 4.2 節 図 2: ブロック分割の例 に示す整形を行った全文をアップロードする.ユー ザは携帯電話にてメールを確かめ,全文にアクセス したい時には携帯電話に付属する Java を用いて全文 にアクセスする.このときテキストを携帯電話でも る.以上ような処理には単語をより短い表現に変換 読みやすいように拡大表示と縮小表示を組み合わせ する縮約 [?, ?] や,日本語では体現止め,丁寧表現 た表示をする.また,Java に対応していない携帯電 の削除などの言い換え [?] がある,以下,書き換え規 話では WWW ブラウジング機能を用いて全文にア 則の例を示す. クセスする.この場合は全文へアクセスするための URL をメールに添付する. 3 • [0-9]+月 [0-9]+日 → [0-9]+/[0-9]+ (11 月 12 日→ 11/12) 要約生成 3.1 要約生成の流れ ここでは,指定サイズより長い本文を持つメール • 名詞 スル 助動詞。 → 名詞。 (内閣が解散しました。→内閣が解散。) の要約生成について説明をする. 本手法では,指定されたサイズ内にできるだけ文 を詰め込む.また,メールのタイトルは本文と別に 考え,必ずユーザが確認できるとする.メールの全 体を把握することが目的なため,メール全体から,互 いに文意が大きく異なる文を選択する.また,メー ルには典型的なものが多いため,文がメール本文の どこに位置するかは,その文を要約に含めるか含め ないか判断するための重要な手がかりとなる. そこで,メールを空白行などで区切り,1文ごと に切り分ける.それぞれの文に対して重要度を計算 し,文を抽出することで要約を生成する.その際 3.2 に示すヒューリスティックなルールによる文の書き換 3.3 メールのブロック分割と署名判断 また,メールには署名が添付されていることが 多い.ここでは,要約の前処理として,署名を要約 の対象から排除する. 署名判断の前処理として,メールの本文をブロック に分割する.本稿では,メールのブロックを1.メー ルのタイトル.2.メールの本文を空白行,つまり 2個以上の連続する改行,または記号だけの行で分 割したものをメールのブロックとする.例外として メールの引用文はその前後に関わらずブロックとす る.定義に従ってメールをブロック分割した例を図 ??に示す.薄い線で区切られた1長方形が1つのブ ロックとなる.メールをブロックに分割した後に,署 名の位置を特定する.氏名,URL,電話番号,住所 3.2 ヒューリスティックなルールでの文の書き換え のうち2つ以上を含み,かつ,メールの末尾から2 メールのテキストを指定サイズに要約するために, ブロック以内にあるブロックを署名とした.これに 出力される要約文は1文字でも減らしたい.そこで よって署名と判断されたブロックは 3.3 節に示す文 文から必要と思われる部分を中心に選択し,出力す 抽出の対象にはならない. え処理も行い,要約に含める文自体も短くする. 日本ソフトウェア科学会第 20 回大会(2003 年度)論文集 3.4 文間の類似度と位置情報を用いた文抽出 メールの要約はメール全体の内容が想像しやすい ようにメール全体を網羅的にカバーしているのが好 ましいと考える. そこで既に要約に含まれる文との類似度と,文の メール内での位置に注目した文抽出を行う.まず, メールを上述の方法でブロックに切り分け,さらに 1文ごとに切り分けておく.そこで各文の重要度を 以下のように求める. ここでは重要度を測る手段として MMR[?] を参考 にし,文の重要度を (1) で測る. key(s) = αplace(s) − β max sim(s, t) t∈T inputs: title:メールのサブジェクト Body:メールの本文 N :要約文のサイズ variables: Selected:抽出文として選択されている文 Summary:要約 function メール要約 ( title, Body, N ) Selected ← {title} while Summary の総サイズ <N Body 中の全ての文に対して key の計算をする sentence ← arg maxs∈Body key(s) sentence を書き換えによって短くし Summary に追加 Selected ← Selected ∪ {sentence} end Summary を元メールの出現順にソートする return Summary の 0 から N 文字目 図 3: 文間の類似度と位置情報を用いた要約 (1) α + β = 1, α > 0, β > 0 ■要約前■ subject : 第 46 回情報処理学会数理モデル化.... ここで s は対象としている文,α,β は定数.T は既 ジェクトを T に含めておく.関数 place(s) は文 s の メーリングリス........:******** 締切が迫ってま いりましたので,再度ご連絡させていただきます ******** メーリングリストをお借りして,第 46 回情報処......(MPS) 研究会の CFP を,再度ご案 内させていただきます.重複して受.......... 第 46 回 MPS 研究会は,9 月 19........... 位置がブロックの先頭であればあるほど高い値を取 ↓ に抽出文として選択されている文の集合とする.要 約メールのサブジェクトには,元メールのサブジェ クトをそのまま使うため,文抽出処理開始前にサブ る関数で (2) で計算する.ここで文番号とは各ブロッ ■要約後■ ク内で1番目に出てくる文を1とし,2番目に出て subject : 第 46 回情報処理学会数理モデル化.... くる文を2と,ブロック内の文に順番に番号を付け メーリングリスト登録のみなさま:締切が迫って まいりましたので,第 46 回 MPS 研究会は,9 月 19 日 (金) に広島市立大学にて開催される。 たものとする. place(s) = 1 ブロック内で s の出現する文番号 図 4: 要約の例 (2) また関数 sim(s,t) は文 s と文 t の自立語の一致度と し (3) で定義する.本研究では自立語を文を日本語 形態素解析システム茶筅 [?] を用いて形態素解析した 結果の名詞,動詞,形容詞とした. sim(s, t) = 3 s と t で一致する自立語の数 s の自立語と t の自立語の数で多い方 4 携帯電話のディスプレイに合わせた表示 4.1 拡大,縮小表示を用いたメール表示 メールの全文を閲覧する際,必要な情報だけを発 見する斜め読みをすることがある.しかし,携帯電 (3)話のような小さいディスプレイでは一度に全体を見 渡せないためメールの先頭から順に閲覧せざるをえ 全ての文に対して重要度を計算し,重要度の最も高 ない. いものを抽出文リストに追加する.その際 3.2 に示し 文の一部を表示する縮小表示とユーザが読みたい た文の書き換えを行ったものを要約に追加する.重 行の周辺を表示する拡大表示を切り替え,メールを 要度の最も高い文を追加するごとに,重要度を再計 閲覧するシステムの試作を J2ME の MIDlet として 算する.要約が指定サイズを越えた時に,要約に含 実装した(図??).ユーザは縮小表示の画面を見なが まれるそれぞれの文を,元の文章で出現する順に並 らポインタを動かし,決定キーを押すことで,ポイン べ替え,指定サイズに切り詰めて,処理を終了する. タの回りの文を拡大表示する.縮小表示での1行は 詳しいアルゴリズムを図??に示し,図??にメールを デスクトップでメールを表示させたときの一行と同 要約したものの一部を例として示す. じになり,各行の内容を判断する参考となる部分を 日本ソフトウェア科学会第 20 回大会(2003 年度)論文集 5 4 考察 実際にシステムを利用した効果についての考察を 以下にまとめる.要約は,メール全体から文を抽出 するためメール全体を網羅しており,全文を閲覧す る際の参考にもなる.全文を閲覧する際に拡大,縮 小表示を用いたメール表示を利用した場合,パソコ ンのメーラにてメールを閲覧しているように文が表 示されるため,イベントの通知のような,メールの 構成にテンプレートがある場合の閲覧に効果的であ 図 5: 拡大,縮小を用いたメールテキスト表示 る.例えばレクリエーションの開催日の書かれた文 には行頭に【開催日:】といった手がかりがあるた め,そのようなメールを閲覧する際,とりあえず開 催日からといった目的を持った閲覧ができる.また, 記号の削除や,改行のなどのルールを用いたメール の整形を行った結果.携帯電話のディスプレイに一度 に表示される情報も多くなりメールの閲覧がスムー ズに行える.また,記号などの携帯電話での表示に 必要のない文字を削除することでメール全体が短く なり通信量が減るというメリットもある. 図 6: テキスト整形を行ったメール表示 6 可読にしている.可読部分は,全文を WWW サーバ に転送する時にあらかじめ<I>と</I>で囲んでおく. 実行例(図??)では行の先頭6文字を<I>と</I>で 囲っている.拡大表示では縮小表示中にポインタが 指していた行を中心に表示し,通常のメール閲覧と 同様にスクロールさせることができる.実行例(図 ??)では各行の先頭6文字を可読にしている.これ によりユーザがメール内の必要な情報へアクセスす る時,メール全体が見渡しやすくなる. 4.2 WWW 閲覧機能を用いたメールの表示 組み込み Java の機能のない携帯電話のために,ブ ラウザを用いてメールの全文にアクセスする機能を 実装した.デスクトップ向けメールを携帯電話で直 接表示すると,デスクトップで見ることを前提とし てつけられた空白業や折り返しが携帯電話の小さい ディスプレイでの表示を読みにくくする要因となる. そこで,全文を WWW サーバにアップロードする際 に,メールを読みやすく整形しておく.整形のルー ルには,記号のみの行を削除,インデントの削除な どを用いた.図??に整形結果を携帯電話で表示した ものを示す. まとめ 本稿では,携帯電話での転送されてきたメール閲 覧の現状を改善するための内容簡略化手法とその表 示手法を提案した.メールの要約にはメール内の各々 の文の類似度と文のメール内での位置に注目した要 約を用いた.また,表示に際してもデスクトップで の斜め読みを携帯電話でのディスプレイでもできる ようにするため文字の拡大,縮小を新規に用いた. 参考文献 [1] Buyukkokten.O,GarciaMolina.H,Paepcke.A:Accordion Summarization for End-Game Browsing on PDAs and Cellular Phones:ACM SIGCHT01,pp.213220,2001 [2] J.Carbonell and J.Goldstein. The use of mmr, diversity-based reranking for reordering documents and producing summaries:InProceedings of the 21st Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval 1998 [3] Corston-Oliver,S:Text Compaction for Displaying on Very Small Screens, In Proceedings of the Workshop on Automatic Summarization, NAACL,2001 [4] 中川祐志, 渡辺聡彦:携帯端末向けコンテンツ変換と自 然言語処理:情報処理 43 巻 12 号, 情報処理学会,2002 [5] 松本裕治, 北内啓, 山下達雄, 平野善隆, 今一修, 今村友 明:日本語形態素解析システム「茶筅」2.3.1
© Copyright 2024 Paperzz