1月12日 前回の続き 談話解析 プラン認識に基づく理解 発話の理解 行為

1月12日 前回の続き
談話解析
プラン認識に基づく理解
„
個々の発話
„
対話
„
„
発話の理解
„
„
„
„
相手の心的状態(信念や意図)を変化させる行為
世界に作用し何らかの目的(ゴール)を達成するた
めの計画(プラン)
行為の記述
駅の案内所での客と駅員の会話
„
乗車(行為者,列車,駅)
„
客:モントリオール行きの列車は何時に出発しますか.
駅員A:3時15分です
駅員B:3時15分に7番ゲートからです.
„
„
„
„
„
„
ウィンザー行きの列車は何時に発車するかご存知ですか.
駅員A:はい
駅員B:3時15分に出発します.
„
1月12日
文章生成
「モントリオール行きの列車は何時
に発車しますか」 駅員の答え
„
„
„
客はモントリオール行きの列車の発車時刻を知りたがっ
ている
客はモントリオール行きの列車に乗りたいらしい
列車に乗るには客は下の前提条件を満たさなければな
らない.
„
„
„
„
文章生成
„
„
„
„
対話システム
翻訳システムの出力
要約システムの出力
質問応答システムの出力
前提条件の制約
„
„
いる(行為者,場所,時間)
制約:発車駅(列車,駅)
出発場所(列車,場所)
出発時間(列車,時間)
前提条件: いる(行為者,場所,時間)
効果:乗車状態(行為者,列車)
発車駅,場所,時間
当駅は発車駅である.時間は聞かれたので答える.乗車
ゲートも答える必要がある.
「3時15分に7番ゲートからです.
1
自然言語生成に必要な種々の
作業と資源
文書生成システム
非記号的データ
„
„
„
領域知識
概念化/
命題化
中間言語方式の機械翻訳
伝達内容
の選択
伝達内容
の構成
深層生成
非記号的データを入力とするシステム
„
„
話し手の意図
概念化された伝達内容を入力とするシステム
テキストプラン
株式市場レポート,天気予報,スポーツの試合のレ
ポート
談話関係
文境界 の表出 文法的
選択
の決定
伝達意図を入力とするシステム
„
談話構造に関する知識
領域に関する聞き手の
モデル
領域知識に関する質問応答システム
参照表現
命題の
語選択 の選択
集約
表層生成
語彙・文法知識
言語に関する聞き手
のモデル
テキスト
Lispプログラムについてアドバイスする
エキスパートシステムとユーザの対話
深層生成
„
話し手の意図を入力とし,それを達成する
テキストの伝達内容を選択する
„
„
„
„
„
„
S1: どのような内容のアドバイスがほしいですか?
u1: プログラムの保守性を向上させるためのアドバイスをください.
s2: (setq x 1) は (setf x 1)に変更したほうがいいです.
u2: なぜ?
システムのゴール:setqからsetfへの書換えを実行するように
ユーザを説得する
s3:
„
„
„
„
参照表現の選択
参照対象を特定するのに必要な情報
表層生成
„
„
„
„
深層生成で生成された伝達内容(テキスト
プラン)をテキストに変換する作業
文境界の決定
構文の選択
語の選択
私は今,
保守性向上の書換えを適用することによって,
プログラムの保守性を高めようとしています.
setqからsetfへの書換えは保守性向上の書換えの一つなのです.
„
矢印で指している三角を言葉で指定するには?
2
参照表現の選択
基本語彙レベル
参照表現の選択
聞き手のモデルの考慮
動物
„
獣
犬
„
„
„
„
„
動物にかまれた
獣にかまれた
犬にかまれた
ラブラドールにかまれた
隣の家のナナにかまれた
ラブラドール
„
„
隣の家のナナ
聞き手が良く知っていると推定できる語を優先す
る.
それに該当する適当な語がないときは,説明的
な定義で言い換える.
説明的定義についても,聞き手が知っていると
推測される情報を優先する.
参照表現の選択
文脈の影響1
„
参照対象が未出の実体である場合
„
„
聞き手が既に知っていると推定できる実体を参照する場合
„
参照対象と同じクラスの実体が先行文脈に現れている場合
„
„
定名詞句で参照する.
「次にキュウリを用意します.皮はきれいにむいてしましましょう」
„
<原因>(主部)太郎は今朝寝坊してしまった
(従属部)太郎は,昨晩夜ふかしをした
太郎は,昨晩夜ふかしをしたので,今朝寝坊し
てしまった.
参照対象が前文と現在の文でともに焦点になっている,又は参照対象が
既に先行文脈に現れていて,前文と現在の文でともに焦点になっている対
象が現在の文で省略されている場合
„
„
„
„
ゼロ代名詞又は指示詞が使える.
「山田さんはその日の朝ようやく八ヶ岳の絵を完成させました.さっそく幸子さ
んにφ見せました.
それ以外の場合
„
二つの実体を区別する属性を用いて代用詞を修飾する.
修辞的関係の表出と文境界の
決定
„
„
固有名詞または定名詞句で参照する
先行文脈には現れていないが,既出の実体から聞き手がそ
の存在を推論できる実体を参照する場合
„
参照対象が既出の実体である場合
参照対象を特定するための情報を付加して表出する.
「昨日山田さんと行ったレストラン」
„
„
„
„
初めて談話に現れる実態を参照する場合
„
„
参照表現の選択
文脈の影響2
「音量を調節するつまみ」,「先ほど切ったタマネギ」,「最初の曲がり角」
大域的文脈(談話状況)から特定される実体
„
„
話し手・聞き手はそれぞれ一人称・二人称の呼称を用いて参照できる.
談話状況に存在する対象は「これ,それ,あれ」などの直示的参照表現で
参照する
修辞的関係表現の難しさ
接続表現の選択
„
<条件>という修辞的関係を表す英語の
接続表現
„
„
„
„
„
<目的>「∼するために」
<原因>「∼する/したので」
„
if
when
after
only if
3
修辞的関係表現の難しさ
文境界の決定
„
„
„
„
修辞的関係表現の難しさ
接続表現の省略
二つの命題が何らかの修辞的関係にあるとき,それらの
命題は適当な接続表現を使って一つの文にまとめること
が出来る.
しかし,さまざまな命題を無制限に一つの文に詰め込む
と,極端に読みにくい文ができる可能性がある.
例 新規書類が開いたら,文書をつくったあとに用紙設
定をしようとすると余白がずれる可能性があるので,文
書をつくる前に用紙設定をします.
例 新規書類が開いたら,文書をつくる前に用紙設定を
します.文書をつくったあとに用紙設定をしようとすると余
白がずれる可能性があります.
„
新規書類が開いたら,文書をつくる前に余白調
整などの用紙設定をします.(<動機づけ>)文
書をつくったあとに用紙設定をしようとすると余
白などがずれる可能性があります.
伝達内容の集約(集約規則)
1.
複数の命題が同一の主語をもつとき,それらを
一つの命題に集約することができる.
„
2.
センテンスプラン
選択によって得られる一文当たりの内部表現
金丸は大学院生だ.金丸は頭が良い.→金丸は頭
の良い大学院生だ.
複数の命題が同一の述語をもつとき,それらを
一つの命題に集約することができる.得られる
命題は,もとの命題に対する複数の主語を持つ
„
センテンスプラン
文法制約
太郎は大学生だ.次郎は大学生だ.→太郎も次郎
も大学生だ
表層文字列
「山田さんは昨年八ヶ岳の絵を描いた」
に相当するセンテンスプラン
描く
動作主:[1] 人&目上
名前:山田
単一化文法の例
„
„
動作対象:[2] 絵
クラス限定:山
名前:八ヶ岳
„
時間位置:[3] 昨年
発話行為:断定
接続関係:なし
主題:[1]
情報量:[3]<[2]
„
„
„
„
„
(0)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
s’/Sem→s( )Sem.
s(Subcat)/Sem→Comp1, s([Comp1|Subcat])/Sem
pp/Sem→np/NP, p(NP)/Sem
s([pp/o(O), pp/ga(S)])/draw(S,O)→ ‘描く’
np/y 山田さん
np/p 絵
p(NP)/ga(NP)→が
p(NP)/o(NP)→を
4
意味主辞駆動生成の流れ
合成のための生成:要約システム
s’/draw(y,p)
„
(0)
(0)
s([])/draw(y,p)
(1)
„
s([pp/ga(y)])/draw(y,p)
pp/ga(y)
(2)
np/y
p(y)/ga(y)
(4)
(6)
山田さん
„
pp/o(p)
が
(1)
(2)
np/p
p(p)/o(p)
(5)
絵
„
s([pp/o(p), pp/ga(y)])/draw(y,p)
(7)
(3)
を
描く
生成モジュールの構造
内容決定
内容決定
文書構造化
文プランニング
出力の可読性を向上する機会を提供する.表やテンプ
レートはかなり不明瞭で読みにくい.
生成を使えばグラフィックスよりもコンパクトな要約とな
る場合もある.グラフィックスでも,画像の状況説明をし,
はっきりさせるにはテキストが必要なことは多い
生成では,さまざまなテキストプランニング戦略や語彙
選択戦略を用い,テキストを一貫性のあるものにする.
生成の過程で,自然言語表現やそれらの組み合わせ
方を選択することで,さまざまな集約や一般化操作を
合成中に行うことができる.
何を伝えるのか
の決定
„
合成
„
伝達する情報の選択
情報をメッセージの系列で表す
どう伝えるのか
の決定
表層的表出
文書構造化
„
„
„
出力の全体的な構造の決定
要約の修辞構造をプランニング
一貫性表現
文プランニング
„
メッセージ集約
„
„
„
„
メッセージから文への写像
複数メッセージ → 単一文
単一メッセージ → 複数文
語彙選択
„
„
意味表現中の特定の概念を表す語句を選択
固有名詞,定名詞句,不定名詞句,代名詞な
どの参照表現のタイプを選択
5
表層的表出
„
注釈づけされた表現を受け取り,文を生成
文章生成の応用
„
文書作成
„
技術文書
„
„
„
„
„
特許申請書
マニュアル
健康管理レポート
対話システム
要約システム
今後の課題
„
知識の獲得
„
„
知識ベースやモジュールの再利用
„
„
人手 → コーパスからの自動獲得
領域依存性
評価基準,評価
„
„
主観的な評価(人間による)
客観的な評価(計算機による)
6