F-nameのブログ

はてなダイアリーから移行し、更に独自ドメイン化しました。

対話システム(自然言語処理第13回)

SIRIの仕組みを研究するのは面白いかもしれない。

 

発話の意味、質問に対する応答。音声対話システム。
人と自由に知的に対話するロボット。HAL。対話システムの歴史。初期の代表的な。ELISA。カウンセリングの状況を。非常に簡単なルール。ルール文を用いて対話を。意外と対話は続く。SHRDLU。単純なトイワールドに対話を限定。computerに全てが理解される。積み木の状態を把握し対話を行うことが可能。表層的なもの。より現実的に拡張するのは困難。音声ではなくテキスト入出力。90年代から音声による対話システムが。00年頃から電話の自動応答を。コーパスと機械学習による進歩。クラウド型音声認識の発展。人工知能プログラム。SIRI。10年。質問応答を行うことが出来る。雑談対話も。日本でもNTTドコモのコンシェルジュなど。
音声対話システムの前に発話の意味について。文の意味が文脈に依存する。対話における発話。文脈への依存度が大きい。言語学で語用論。人間の対話における発話の意味。聞き手に対する働きかけや意志の表明。依頼勧誘だったり。話し手の発話は行為の一種。字面の意味を超えて解釈することが必要な場合も。間接的な意味を伝達。会話が円滑に進むのは在る原則に基づいているから。会話の公理。協調原理。量、質、関係性、様式。質の公理。真実性のある。様式の公理。明確で簡潔な形で。公理を満たす形で。反することに理由があると判断し深い理解が出来る。月曜日に試験があります。一見関係のない発話?発話の本当の意味。遠回しに勧誘を断っている。嘘を付くことも在るが、単に公理に反するのではなく、推測を促す。
コンピュター処理の話。質問応答。対話の中で頻繁に。対話システム。11年2月スパコンが人気クイズ番組で人間を破る。WATSON。97年にIBMのプログラムがチェスに勝利した以来の。日本語に訳すとすれば、芸術家の画材であった。情報検索のように関連文書をランキングで、ではなく、質問応答。WATSONは究極の成功例。事実型質問。質問文から解答のタイプを推測。長さを示す数値表現や人名、など。関連する表現をランク付けで。言語解析。固有名などの名詞句を抽出。オバマ大統領の出身地。地名を取り出す。頻度や出現頻度の最上位のものを。質問と解答の学習頻度で学習。WATSONは病名診断医療システムなどの検討が。WATSONは同じタイミングでテキスト入力が為されたが、音声認識も可能に。
音声対話システム。10年頃から雑音のある環境についても改善。SIRI。しゃべってコンシェルなどの特徴。対話はタスク志向対話と雑談志向対話。道具的コミュニケーション。会話ボット。人間の日常の対話は混在したものであるのが自然。アラーム設定などの両方を。システム構成。システムに愛着を持ってもらうため?将来は商取引で信頼感を。福祉などの癒やしや安らぎなど、雑談力に期待が。乗換案内システム。出発時刻などが必要。プロ野球の結果を聞いたり。多様な機能。適切なモジュールを選択する為には意図の解釈が必要。発話の文脈依存性の強さ。音楽プレイヤーを起動したいという意図は様々な表現で。音楽を再生して聞くことが目的なので、楽曲名を言うだけかも。多義性の問題。きょうとへ行きたい?ユーザーの意図が乗換案内である場合か雑談の場合か。統計的手法の利用や対話の履歴などを。
タスク志向対話。テンプレートがあれば対話を行うのは比較的容易。現在の音声対話システムは雑談の中で焦点を認識しそれを拠り所に対話しようとするが噛み合わないことも。computerが知的であるかどうか。チューリングテスト。人間の判定者がcomputerを人間と区別がつかわなければ合格。14年6月。審査員の33%が。ウクライナ出身の13歳。英語が母国語でない、など本質的でない工夫がされていて批判が。雑談対話の重要性。
研究者の話。NTTドコモのしゃべってコンシェルの開発者の東中雄一郎。雑談対話システム。タスク志向型対話システムを入社時から。日常会話ではタスクと関係がない要素が多い。社会的結びつきを確認するなど。人間と強調するためには日常対話が出来ることが必要。人間はcomputerを人間として扱う。使い勝手が悪くなる。雑談研究を。文書分類の方法を。経験についての自己開示など。大量の学習データ。ラベルをふってそこから学習。大量のTwitterデータから。Tweet集合から。人工知能ということになる。対話研究の面白い所。対話をすること自体が夢の1つ。対話システムはユーザに直接働きかける。対話ロボットが出来るとそれから影響を。対話そのものも非常に面白い。ターン交代が。非常に様々な現象が。逆に難しさは?言語処理の中でも難しい談話を扱う。談話解析の分野は進んでいない分野。しかしやらないと。評価が非常に難しい。評価セットを準備。対話の正解とは?雑談のような対話では?評価そのものが主観的にならざるを得ない。やり取りは発話の組み合わせから。組み合わせが爆発する。人を研究室に呼んできて評価。コストがかかる。常識の問題が非常に大きい。良いことか悪いことかの判断。対話システムではしゃべってコンシェルが人気。NTTドコモの音声エージェントサービス。電話の機能を呼び出したりする。質問応答機能を。世界で一番高い山は?など。大化の改新といえば誰?レスポンスが速い。商業サービスの難しさ。どんな質問をするか分からない。一番可愛いアイドルは?など色んなものが。一応何らかの答えが。スピードが重要。でないとユーザが使わない。アルゴリズムの高速化。事前に解答を用意したりする。雑談対話システム。雑談対話API。機能を自分のプログラムに組み込める。まだまだ性能を上げなければならないが。現在の研究としての取り組み。雑談対話システムの改善。しっかり覚えておくことは重要。記録とパーソナライズ。横須賀についての重要なニュースを。家族の一員として。たまに変な発言があると会話が破綻する。発話に問題がないかチェックする機能が。常識や高度な言語処理が必要だったり。会話の破綻をデータベース化。スマートフォンの音声エージェント。対話性能はまだまだ。ぜひ多くの人に取り組んでもらいたい。
急に賢くなった?積み重ねや仕組み。身近なものに。お掃除ロボットと雑談する?機械翻訳について。コーパスに基づく。統計モデルと評価尺度。

 

自然言語処理 (放送大学教材)

自然言語処理 (放送大学教材)