1月12日 前回の続き 談話解析 プラン認識に基づく理解 個々の発話 対話 発話の理解 相手の心的状態(信念や意図)を変化させる行為 世界に作用し何らかの目的(ゴール)を達成するた めの計画(プラン) 行為の記述 駅の案内所での客と駅員の会話 乗車(行為者,列車,駅) 客:モントリオール行きの列車は何時に出発しますか. 駅員A:3時15分です 駅員B:3時15分に7番ゲートからです. ウィンザー行きの列車は何時に発車するかご存知ですか. 駅員A:はい 駅員B:3時15分に出発します. 1月12日 文章生成 「モントリオール行きの列車は何時 に発車しますか」 駅員の答え 客はモントリオール行きの列車の発車時刻を知りたがっ ている 客はモントリオール行きの列車に乗りたいらしい 列車に乗るには客は下の前提条件を満たさなければな らない. 文章生成 対話システム 翻訳システムの出力 要約システムの出力 質問応答システムの出力 前提条件の制約 いる(行為者,場所,時間) 制約:発車駅(列車,駅) 出発場所(列車,場所) 出発時間(列車,時間) 前提条件: いる(行為者,場所,時間) 効果:乗車状態(行為者,列車) 発車駅,場所,時間 当駅は発車駅である.時間は聞かれたので答える.乗車 ゲートも答える必要がある. 「3時15分に7番ゲートからです. 1 自然言語生成に必要な種々の 作業と資源 文書生成システム 非記号的データ 領域知識 概念化/ 命題化 中間言語方式の機械翻訳 伝達内容 の選択 伝達内容 の構成 深層生成 非記号的データを入力とするシステム 話し手の意図 概念化された伝達内容を入力とするシステム テキストプラン 株式市場レポート,天気予報,スポーツの試合のレ ポート 談話関係 文境界 の表出 文法的 選択 の決定 伝達意図を入力とするシステム 談話構造に関する知識 領域に関する聞き手の モデル 領域知識に関する質問応答システム 参照表現 命題の 語選択 の選択 集約 表層生成 語彙・文法知識 言語に関する聞き手 のモデル テキスト Lispプログラムについてアドバイスする エキスパートシステムとユーザの対話 深層生成 話し手の意図を入力とし,それを達成する テキストの伝達内容を選択する S1: どのような内容のアドバイスがほしいですか? u1: プログラムの保守性を向上させるためのアドバイスをください. s2: (setq x 1) は (setf x 1)に変更したほうがいいです. u2: なぜ? システムのゴール:setqからsetfへの書換えを実行するように ユーザを説得する s3: 参照表現の選択 参照対象を特定するのに必要な情報 表層生成 深層生成で生成された伝達内容(テキスト プラン)をテキストに変換する作業 文境界の決定 構文の選択 語の選択 私は今, 保守性向上の書換えを適用することによって, プログラムの保守性を高めようとしています. setqからsetfへの書換えは保守性向上の書換えの一つなのです. 矢印で指している三角を言葉で指定するには? 2 参照表現の選択 基本語彙レベル 参照表現の選択 聞き手のモデルの考慮 動物 獣 犬 動物にかまれた 獣にかまれた 犬にかまれた ラブラドールにかまれた 隣の家のナナにかまれた ラブラドール 隣の家のナナ 聞き手が良く知っていると推定できる語を優先す る. それに該当する適当な語がないときは,説明的 な定義で言い換える. 説明的定義についても,聞き手が知っていると 推測される情報を優先する. 参照表現の選択 文脈の影響1 参照対象が未出の実体である場合 聞き手が既に知っていると推定できる実体を参照する場合 参照対象と同じクラスの実体が先行文脈に現れている場合 定名詞句で参照する. 「次にキュウリを用意します.皮はきれいにむいてしましましょう」 <原因>(主部)太郎は今朝寝坊してしまった (従属部)太郎は,昨晩夜ふかしをした 太郎は,昨晩夜ふかしをしたので,今朝寝坊し てしまった. 参照対象が前文と現在の文でともに焦点になっている,又は参照対象が 既に先行文脈に現れていて,前文と現在の文でともに焦点になっている対 象が現在の文で省略されている場合 ゼロ代名詞又は指示詞が使える. 「山田さんはその日の朝ようやく八ヶ岳の絵を完成させました.さっそく幸子さ んにφ見せました. それ以外の場合 二つの実体を区別する属性を用いて代用詞を修飾する. 修辞的関係の表出と文境界の 決定 固有名詞または定名詞句で参照する 先行文脈には現れていないが,既出の実体から聞き手がそ の存在を推論できる実体を参照する場合 参照対象が既出の実体である場合 参照対象を特定するための情報を付加して表出する. 「昨日山田さんと行ったレストラン」 初めて談話に現れる実態を参照する場合 参照表現の選択 文脈の影響2 「音量を調節するつまみ」,「先ほど切ったタマネギ」,「最初の曲がり角」 大域的文脈(談話状況)から特定される実体 話し手・聞き手はそれぞれ一人称・二人称の呼称を用いて参照できる. 談話状況に存在する対象は「これ,それ,あれ」などの直示的参照表現で 参照する 修辞的関係表現の難しさ 接続表現の選択 <条件>という修辞的関係を表す英語の 接続表現 <目的>「∼するために」 <原因>「∼する/したので」 if when after only if 3 修辞的関係表現の難しさ 文境界の決定 修辞的関係表現の難しさ 接続表現の省略 二つの命題が何らかの修辞的関係にあるとき,それらの 命題は適当な接続表現を使って一つの文にまとめること が出来る. しかし,さまざまな命題を無制限に一つの文に詰め込む と,極端に読みにくい文ができる可能性がある. 例 新規書類が開いたら,文書をつくったあとに用紙設 定をしようとすると余白がずれる可能性があるので,文 書をつくる前に用紙設定をします. 例 新規書類が開いたら,文書をつくる前に用紙設定を します.文書をつくったあとに用紙設定をしようとすると余 白がずれる可能性があります. 新規書類が開いたら,文書をつくる前に余白調 整などの用紙設定をします.(<動機づけ>)文 書をつくったあとに用紙設定をしようとすると余 白などがずれる可能性があります. 伝達内容の集約(集約規則) 1. 複数の命題が同一の主語をもつとき,それらを 一つの命題に集約することができる. 2. センテンスプラン 選択によって得られる一文当たりの内部表現 金丸は大学院生だ.金丸は頭が良い.→金丸は頭 の良い大学院生だ. 複数の命題が同一の述語をもつとき,それらを 一つの命題に集約することができる.得られる 命題は,もとの命題に対する複数の主語を持つ センテンスプラン 文法制約 太郎は大学生だ.次郎は大学生だ.→太郎も次郎 も大学生だ 表層文字列 「山田さんは昨年八ヶ岳の絵を描いた」 に相当するセンテンスプラン 描く 動作主:[1] 人&目上 名前:山田 単一化文法の例 動作対象:[2] 絵 クラス限定:山 名前:八ヶ岳 時間位置:[3] 昨年 発話行為:断定 接続関係:なし 主題:[1] 情報量:[3]<[2] (0) (1) (2) (3) (4) (5) (6) (7) s’/Sem→s( )Sem. s(Subcat)/Sem→Comp1, s([Comp1|Subcat])/Sem pp/Sem→np/NP, p(NP)/Sem s([pp/o(O), pp/ga(S)])/draw(S,O)→ ‘描く’ np/y 山田さん np/p 絵 p(NP)/ga(NP)→が p(NP)/o(NP)→を 4 意味主辞駆動生成の流れ 合成のための生成:要約システム s’/draw(y,p) (0) (0) s([])/draw(y,p) (1) s([pp/ga(y)])/draw(y,p) pp/ga(y) (2) np/y p(y)/ga(y) (4) (6) 山田さん pp/o(p) が (1) (2) np/p p(p)/o(p) (5) 絵 s([pp/o(p), pp/ga(y)])/draw(y,p) (7) (3) を 描く 生成モジュールの構造 内容決定 内容決定 文書構造化 文プランニング 出力の可読性を向上する機会を提供する.表やテンプ レートはかなり不明瞭で読みにくい. 生成を使えばグラフィックスよりもコンパクトな要約とな る場合もある.グラフィックスでも,画像の状況説明をし, はっきりさせるにはテキストが必要なことは多い 生成では,さまざまなテキストプランニング戦略や語彙 選択戦略を用い,テキストを一貫性のあるものにする. 生成の過程で,自然言語表現やそれらの組み合わせ 方を選択することで,さまざまな集約や一般化操作を 合成中に行うことができる. 何を伝えるのか の決定 合成 伝達する情報の選択 情報をメッセージの系列で表す どう伝えるのか の決定 表層的表出 文書構造化 出力の全体的な構造の決定 要約の修辞構造をプランニング 一貫性表現 文プランニング メッセージ集約 メッセージから文への写像 複数メッセージ → 単一文 単一メッセージ → 複数文 語彙選択 意味表現中の特定の概念を表す語句を選択 固有名詞,定名詞句,不定名詞句,代名詞な どの参照表現のタイプを選択 5 表層的表出 注釈づけされた表現を受け取り,文を生成 文章生成の応用 文書作成 技術文書 特許申請書 マニュアル 健康管理レポート 対話システム 要約システム 今後の課題 知識の獲得 知識ベースやモジュールの再利用 人手 → コーパスからの自動獲得 領域依存性 評価基準,評価 主観的な評価(人間による) 客観的な評価(計算機による) 6
© Copyright 2024 Paperzz