2022 Fiscal Year Annual Research Report
人と社会的に共生する対話システムのための行動決定モデル基盤技術の確立
Project Area | Studies on intelligent systems for dialogue toward the human-machine symbiotic society |
Project/Area Number |
19H05693
|
Research Institution | NTT Communication Science Laboratories |
Principal Investigator |
杉山 弘晃 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 協創情報研究部, 主任研究員 (30742283)
|
Co-Investigator(Kenkyū-buntansha) |
石黒 浩 大阪大学, 大学院基礎工学研究科, 教授 (10232282)
中村 泰 国立研究開発法人理化学研究所, 情報統合本部, チームリーダー (70403334)
前田 英作 東京電機大学, システムデザイン工学部, 教授 (90396143)
|
Project Period (FY) |
2019-06-28 – 2024-03-31
|
Keywords | 大規模対話モデル / 話者モデル化 / 関係構築 |
Outline of Annual Research Achievements |
A03班では,人と長期間にわたり共生し自然に対話し続けるために不可欠な,課題A: システム自身の行動を決定するモデルの構築,課題B: ユーザの行動決定モデルの推定,課題C; 周囲の人間関係の理解に取り組んでいる. 課題Aについては,システムが置かれた状況に応じた応答を行うモデルの一つとして,時間情報に基づく応答生成に関する研究を行った.従来のシステムは時間帯や季節などの情報を考慮せず発話を生成しているものがほとんどであるため,しばしば時間的に不自然な発話を生成してしまう問題がある.Twitterデータに付与されている,ツイートされた時間情報を利用して大規模対話モデルの事前学習を行うことで,時間的な自然さの評価が可能であることを確認している.また,言語的な行動以外にも,対話ロボットのマルチモーダルな表出についての研究も進めている. 課題Bについて,特定話者の対話パターンのモデル化について取り組んでいる.従来の話者のモデル化研究は,少数のプロフィールを表す文で話者を表現し,それらの文に表層的に矛盾しない発話を生成することに重きが置かれていた.しかしながら,特定のユーザの振る舞いを予測するには,そうした粗いモデル化では不十分である.我々は,各話者を話者空間に埋め込みつつ,その話者埋め込み表現に紐づけて各話者の応答パターンを学習することで,表層的な表現のみならず応答として特定の話者らしい発話の生成を目指している.加えて,対話を通した相手話者の選好の推定など,オンザフライでユーザの話者性を推定する取り組みも進めている. 課題Cについて,人同士が長期間対話し続けるデータや,4人が組となってしばらく対話し続けるデータを取得し,人間関係がどのように醸成されていくのかについて調査している.合わせて,長期間対話し続けるシステムのプロトタイプを構築し,課題の分析にも取り組んでいる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
課題Aの「システム自身の行動を決定するモデルの構築」について,基盤となる大規模言語モデル・対話モデルを構築するとともに,時間情報や周辺の画像情報に基づく発話生成等,より具体的・実際的な設定での研究を進められており,課題Aの研究目的の達成に対して着実に研究を遂行できている. 課題Bの「ユーザの行動決定モデルの推定」について,引き続き対話を通した相手話者の選好推定に関する研究,および特定個人の話者モデル化・評価尺度の高精度化を進めている.ユーザのシンプルな選好に加え,大規模対話モデルを利用することで,考え方やより複雑な条件を含む嗜好などの推定・再現を実現できつつある. 課題Cの「周囲の人間関係の理解」について,人間同士が長期間対話した際の関係性の変化についての分析を進めている.また複数人対話の中の2者間ごとの関係性の分析や,人間関係を踏まえた対話を実現するための取り組みも並行して進めており,複数人の人間関係に基づく対話生成の土台ができつつある.
|
Strategy for Future Research Activity |
現在,ChatGPTを始めとする大規模言語モデルの性能が極めて急速に進展している.特に,実用的な文書の読解やQAタスク等については,誤った情報を生成しうるhallucination errorの問題は残っているものの,人がチェックする前提であれば,十分実用レベルに達しつつある.一方で,本研究課題で扱っている,話者の個人性のモデル化や実世界の状況を踏まえた応答生成,人とシステムとの関係構築などは未だ取り組みが十分には進んでいない領域であり,世界的に見ても先行できている. 課題Aの「システム自身の行動を決定するモデルの構築」について,タスク対話の領域ではAutoGPT等の自己判断型タスク達成システムの検討が進められており,この技術を雑談対話の領域に適用することを検討している.この技術により,システム自身の判断に基づいてシステム自身の価値観をアップデートし続ける枠組みを開発する. 課題Bの「ユーザの行動決定モデルの推定」について,現在はユーザのシンプルな嗜好の推定を実現しているが,今年度はより詳細かつ複雑な,考え方や価値観の推定に取り組んでいく.特に,多数の特定個人のモデル化に取り組む. 課題Cの「周囲の人間関係の理解」について,現在は人間同士が長期間対話した際の関係性の分析を進めているが,人間同士の振る舞い(特に非同期の対話における発話間の間)を再現し対話するシステムを構築し,システムと人の違いについて明らかにするとともに,人の集団においてそれぞれと関係構築可能なシステムの実現を目指す.
|
Research Products
(29 results)