新たな対話の始まり

NAISTの知能コミュニケーション研究室で、コミュニケーションに関連する様々な技術を研究しています。今回の記事では、人とコンピュータのコミュニケーションを可能とする「対話システム」の研究について紹介します。対話システムはコールセンターの自動受付や雑談などの分野で既に実用化されているが、NAISTでは、今までにできなかった応用に取り組む新しい対話システムの枠組みを目指しています。

コミュニケーションの苦手を克服する「自動ソーシャルスキルトレーナー」

(田中宏季、D3)

私たちの生活において他の人と関わる状況というのは非常に多く存在します。例えば、雑談、プレゼンテーション、友達と遊ぶ、上司への報告など。皆さんはこれらのことが得意でしょうか、それとも不安に感じてしまうでしょうか。これらのコミュニケーションスキルは人との関係作りにおいて重要であり、生活の質（QoL）とも密接に関わっていることが近年わかってきています。一方で、コミュニケーションを苦手としている人々の傾向として、コンピュータなどの社会とは無関係なところにおいて高い能力を発揮することがわかっています。この背景から、対話システムをコミュニケーション支援に応用するような研究プロジェクトを奈良教育大学と共同で本年度からスタートさせました。

コミュニケーションを支援する対話システムを作るために、従来の認知行動療法の枠組みを参考にしました。ユーザが対話システム上の仮想的なエージェントと音声対話していく中で、コミュニケーションのスキルを学習していきます。本研究では、第一段階として「上手に話を伝えるトレーニング」を対話システムに実装しました。まずユーザがエージョントに向かって、「最近あった出来事」を伝えます。その際、エージェントは聞き役として頷きなどの反応をし、同時にユーザの音声と動画も収録します。収録したデータから、ユーザの言語•非言語情報を検出し、それを標準的なモデルと比較して、良かった点と改善点をリアルタイムでユーザに提示します。ユーザはフィードバックを見ることによって、自分の話の伝え方について客観的なアドバイスを受けることが可能になります。大学院生が本システムを使用したトレーニングを受けたところ、従来の本によるトレーニングを行った群と比較して、有意に話を伝えるスキルが向上していたことを確認しました。また自閉スペクトラム症（ASD）の児童1名が本システムを使用したところ、トレーニング前後でのスキルの向上が見られました。これらの結果から、対話システムを使用したコミュニケーション支援技術が有効であることがわかりました。下のビデオで、実際にシステムを使っている様子をご覧いただけます。

今後は、エージェントの振る舞いおよびトレーニングの仕方をより人間らしくするために、実際の人間による認知行動療法をデータ収録し、システムに反映していく研究を進めていく予定です。本研究が、コミュニケーションに困っている人々の助けになれば本当に嬉しく思います。

研究の詳細については、教育工学研究会で報告しています。

人の心を動かす「説得する対話システム」

(平岡拓也、D2)

従来の対話システムは、ユーザの望み通りに、質問に答えたり、チケットを予約したり、雑談をしたりしてきました。しかし、実際に人間と話す時は、様々な意見を出し合ったり、議論したりすることもあります。我々の研究では、ユーザに合わせるだけではなく、ある目標に向かってユーザに働きかける「説得対話システム」を研究しています。実際の会話では説得が行われる状況は実に多様ですが、本節では、相手を不快にさせずに説得を行う状況を想定した、2つのシステムについて紹介します。

研究室勧誘システム

最初に紹介するシステムの特徴は、別の話題から、システムがユーザに注目してほしい話題へと誘導を行うことです。このような誘導が必要な状況の一例として、NAISTに入学して、研究室を選ぼうとしている学生を特定の研究室へ勧誘する場面が考えられます。このような場合、研究室を探している学生はどのような研究をしたいかの大まかなイメージがあっても、具体的に各研究室でどのような研究が行われているかが分からない。その中で、システムが情報を提供し、学生のイメージとシステムの誘導したい研究室を結びつけることができれば、その学生が研究室に入る可能性が高くなります。我々は、その学生が興味の持つことと関連する別の話題を提示することで、システムが目標とする話題へと対象の興味を移す枠組みを提案しました。この枠組みの中では、会話を通して、ユーザの興味を逐次推定する手法や、話題間の関連についての知識の自動獲得に関する提案等も行われています。実際にシステムが使われている様子は下の映像にご覧いただけます。

カメラ販売システム

そして、二番目に紹介するシステムの特徴は説得のプロフェッショナルの良い点を積極的に反映していることです。具体的には、説得のプロとして、セールスマンに着目しました。家電売店でのカメラ販売を想定して、実際に店員として働く方々に客がカメラを購入するように説得してもらいました。そして、どの程度客を満足させつつ、カメラを販売できたかを基準に、店員の説得の上手さをスコアリングしました。この説得の分析を通して、会話中の特徴からこのスコアを予測するモデルを構築しました。この予測モデルのスコアが高くなるように会話を行えば、上手い説得が出来たといえるでしょう。我々は、強化学習と呼ばれる枠組みを使って、システムが高いスコアを出せるような会話の仕方を学習させることに成功しています。

説得対話の仕組みの詳細については、日本音響学会や自然言語処理の国際会議COLINGなどで発表しています。

ユーザの好みに合わせる「個人性を持った対話システム」

(水上雅博、D1)

Siriやしゃべってコンシェルを始めとした携帯端末向けの対話システムの普及、PepperやASIMOといった音声対話が可能なロボットの開発は、人間とコンピュータの関係を従来の「道具としてのコンピュータ」から「パートナーとしてのコンピュータ」へと変化させつつあります。ただ、今までどおりの機械的で無機質な会話をしても、対話システムが真のパートナーにはなれない。そこで我々は各ユーザに合わせるような「個人性」を持った対話システムに着目して、様々な研究を進めています。

まず、対話システムが持つ「個人性」を制御する個人性制御システムについて説明します。従来の対話システムでは、一つのシステムは、ユーザ、場所、時間、周囲の環境に関係なく単一の喋り方を行っていました。しかしながら、実際の人間同士の対話においては、人間は自分自身の固有の喋り方に加えて相手との関係や周囲の環境に合わせて喋り方を変えています。我々は、この行為が対話における関係構築に非常に重要な要素であると考え、対話システムに任意の話し方を行わせる枠組みを統計的機械翻訳の技術を用いて提案、実現しています。具体的には、実現したい喋り方のデータを用意して、このデータから個人性変換のモデルを統計的に構築します。この枠組みでは、単に話し方を制御するのみでなく、特定のキャラクタや有名人の話し方を再現することが可能です。このシステムのデモを下記の動画でご覧いただけます：

また、対話システムの応答戦略を個人に適応する研究も行っています。非タスク指向対話では「何を言われたら何と返すか」をパターン化した用例ベース対話という手法があります。この手法では、ユーザの発話に対して、最もそれらしい応答を対話システムが返します。しかしながら、「最もそれらしい応答」というのは、ユーザの好みや状況に合わせて変化するため、一意に決めることは困難です。そこで我々は、その対話で過去にユーザが行った反応とその履歴から、その時々、対話ごとに最適な応答をユーザごとに選択するという手法を提案しています。この手法は、ユーザが満足度を明示しなくても、反応の傾向からおおよその満足度を推定可能な新しい枠組みを持っています。そして、推定された満足度を用いて、ユーザが好む対話の傾向を予測し、複数の応答の中から各々のユーザに合わせて最良の応答を選ぶことに成功しました。これによって、対話システムはユーザにとって最も快適な対話を実現することができます。

これらの研究の仕組みの詳細は、情報処理学会の研究会、IWSDSを始めとする国際会議で発表しています。