Project/Area Number |
22K17958
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
河野 誠也 国立研究開発法人理化学研究所, 情報統合本部, 特別研究員 (20909139)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2024: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 対話システム / エントレインメント現象 / アコモデーション理論 / スタイルシフト / 自然言語生成 / 言い換え / リフレーミング / エントレインメント / 音声対話システム / アコモデーション / 対話分析 |
Outline of Research at the Start |
私たちは普段、他者と対話をするときに相手の社会的属性や、親密さ、その時々の対話の内容などに応じて、相手の言語使用の傾向に近づいたり、離れたりするような対話戦略をとることがある。そのような対話戦略は、相手に近づきたいとか、相手に対して自己を誇示したいとか様々な動機と関連しており、多様な背景を持つユーザと適度な心理的「距離感」を保ち、円滑なコミュニケーションをするために重要である。本研究では、このような人間が備える対話機能をモデル化し、様々なユーザに対して適応的にコミュニケーション調整を行うことが可能な音声対話ロボットを構築するための基盤を確立することを目指す。
|
Outline of Annual Research Achievements |
本研究では、人間の生活空間に根差す対話ロボットが人間と共生していくために必要なコミュニケーション調整機能をきめ細やかなレベルから統合的に理解・モデル化し、様々なユーザに対して適応的にコミュニケーション調整を行うことが可能な対話ロボットを構築するための基盤を確立することを目的とする。2023年度は、2022年度までに開発した対話における話者間の発話の収束・拡散によるコミュニケーション調整の分析手法を高度化した。より具体的には、話者固有の言語モデルが観測された発話に対してどのようなサプライザルを示すのかに基づいたスタイルシフトの評価指標を大規模言語モデルに基づいて構築した。また、構築した評価指標を用いた対話におけるスタイルシフトの分析により、様々な社会的状況下における対話でどのような要素が話者の発話スタイルの変化に影響を与えるのか解明した。さらに、これまでに構築した評価指標を用いて対話システムの応答を生成・再順位付けする手法を提案し、詳細な被験者評価実験を実施した。被験者評価実験を通じて、対話ロボットのためのコミュニケーション調整戦略のモデル化に必要な知見を整理した。さらに、2024年度の研究で活用するために、雑音環境における様々な社会的状況下での、音声の読み上げコーパスを収録した。また、前年度までに構築した言語資源の追加整備を実施した。より具体的には、収録サンプル数の拡張、韻律特徴の自動付与を実施した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
2023年度は、2022年度までに構築した言語資源の整備、評価指標の高度化、システム構築、被験者評価を実施した。本年度の研究成果は、対話システム分野の国際会議であるIWSDS、自然言語処理分野におけるトップ国際会議であるEMNLPに採択されるなど、複数の国際会議論文として発表しており、総合的に見て順調的に進んでいると言える。
|
Strategy for Future Research Activity |
2024年度は、これまでに得られた知見と被験者実験のデータを整理し、ユーザに適応した収束・拡散戦略を自動決定するアコモデーション制御モデルを構築する。さらに、応答生成、音声合成モジュールを統合した全体的システムとして対話ロボットを構築・評価する。また、マルチモーダル情報を含めた被験者データの収集を通じて、収束・拡散における非言語的側面(表情、ジェスチャー)を対話ロボットに取り込むために必要な道筋を立てる。
|