研究領域 | 人間機械共生社会を目指した対話知能システム学 |
研究課題/領域番号 |
19H05693
|
研究機関 | 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 |
研究代表者 |
杉山 弘晃 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (30742283)
|
研究分担者 |
石黒 浩 大阪大学, 基礎工学研究科, 教授 (10232282)
中村 泰 国立研究開発法人理化学研究所, 科技ハブ産連本部, チームリーダー (70403334)
前田 英作 東京電機大学, システムデザイン工学部, 教授 (90396143)
|
研究期間 (年度) |
2019-06-28 – 2024-03-31
|
キーワード | 深層学習ベース大規模対話モデル / 共生する対話システム / ユーザ嗜好推定 |
研究実績の概要 |
人と共生する対話システムには,数ヶ月に亘る長期間,自然に対話し続けられるだけの対話能力が不可欠である.高度な雑談や相談を行う対話システムを実現するプラットフォームとして,世界最大規模のテキスト対話データで学習した,深層学習ベースの対話モデル(大規模対話モデル)を構築し,評価・検証用途で無償公開を行った.また合わせて,Fine-tune(適応学習)に用いる高品質対話コーパスについても無償公開を行った.これらの取り組みにより,英語圏に対して極めて大きな差をつけられていた対話システム研究用のリソースを拡充し,十分に日本語でも対話システム研究を行う土壌を作ることができた.公開したデータやモデルは実際に多数の研究で利用されており,企業・大学を問わず,裾野の拡大に貢献している. 構築したモデルの利用について,A03内では,NTTと東京電機大が連携して,対話ロボットコンペティションに出場し,3位の好成績を収めている.文の尤度を基準に動作する大規模対話モデルの課題である事実性の向上に取り組み,多数の研究業績につなげている.またA01班での利用や,A02班の対話システムライブコンペでも活用されている.さらに,トヨタ自動車と連携し,ドライブ中の風景を話題とする対話システムを実現している.自車位置周辺の店舗情報と,実際に見える車窓画像を外部情報として取り込むことで,見えている店舗や物体を話題とする対話を実現している.実際にユーザと対話システムが置かれている周辺情報を外部情報として利用するという点で,人と共生する対話システムの実現に大きく貢献するものである また,日常の対話からユーザの嗜好などの情報を適切に抽出・推定する技術や,ユーザの感じ方を考慮したシステムの発話決定に関する技術の開発を進めている.さらに,数ヶ月に亘る人同士の対話を収集し,人同士の親密化過程の分析も進めている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
対話能力の根幹を成す部分について,大規模対話モデルを利用することで,大幅に性能を向上することができた.これにより,従来よりもはるかに複雑な事象や情報を対話モデルの入力として取り扱うことができるようになり,ユーザについての記憶や,対話システム自身の個性を適切に出力に反映できるようになっている.特に,ドライブ中の風景を話題とする対話に取り組み,ロボットとユーザの身の回りの情報の理解に基づく対話が可能であることを示すことができた. また,A02班の開催する対話ロボットコンペティションを通し,A03班内で東京電機大と連携することで,外部の知識を利用しよりユーザに役立つ情報を提示するための技術開発を進めることができた.日々対話するシステムにとって,対象とする情報は日々更新されるため,外界の全ての情報を内部に保持することは原理的に不可能である.この課題に対する,有効なアプローチを検証することができた. ユーザとの共生のためには,ユーザ嗜好の推定や,ユーザの価値観の推定,またそれらを考慮した発話生成技術が必要であるが,これらについても順調に開発を進めることができている.さらに,長期間にわたる人同士の対話の分析も進めることができ,来年度に向けた研究の布石を打つことができた.
|
今後の研究の推進方策 |
大規模対話モデルの活用をさらに進め,特にユーザのモデル化やシステム個性の構築に関する研究,およびそれらを活用した発話生成に関する研究を進める.具体的には,ユーザをモデル化することで,ある文をシステムが発話した場合のユーザの反応やユーザが感じる印象を推定し,それに基づいて,実際に発話する文を切り替えることを検討している.また,ユーザとシステムの間の長期間の対話を保持しておき,それを参照することで,2者間の記憶に基づく対話の実現につなげる. システム個性の実現について,システムが反射的に応答した内容についての説明生成にも取り組む予定である.これにより,システムがなぜその発話をしたのかを自身の言葉で説明できるようになり,システム自身の意図や欲求の表出につながると考えられる.
|