2020 Fiscal Year Annual Research Report
Base technology of "Social Expression" for dialogue robots
Publicly Offered Research
Project Area | Studies on intelligent systems for dialogue toward the human-machine symbiotic society |
Project/Area Number |
20H05576
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
石井 カルロス寿憲 株式会社国際電気通信基礎技術研究所, 石黒浩特別研究所, グループリーダー (30418529)
|
Project Period (FY) |
2020-04-01 – 2022-03-31
|
Keywords | 社会的表出 / 動作生成 / アンドロイド / 人型ロボット / 対話状況認識 |
Outline of Annual Research Achievements |
従来のロボットやエージェントは、状況に合った適切な表出ができず、話し方もその動作も単調で人間らさが十分でない。本研究では、発話に伴う、人間らしい自然な話し方と動作を持つ対話ロボット・エージェントの実現を目的とする。特に、対話相手や状況に応じて人はどのように表出を変えるのかを表現できる「社会的表出」の数理モデルを明らかにし、それをロボットやエージェントとのインタラクションに実装することを目指している。 本研究開発の初年度には、特定の状況において、発話に伴う振る舞いの表出がどのように変わるのかを分析し、ロボットに表出した際に印象がどのように変わるのかを検証してきた。まず、指示ジェスチャの種類と対人関係による使い分けにおいて、手の形、手の向き、言語形式、手の動きの速度などのさまざまなファクタの影響を調べるために、アンドロイドロボット(ERICA)に動作を制御し、振る舞いの丁寧さの印象と、対人関係による適切さについて評価を行った。怒り・不満・不快などのネガティブな感情・態度表出において、テレビドラマを題材に俳優の怒り表現の振る舞いを分析し、代表的な動作をアンドロイドロボットに実装した。印象評価を行った結果、生成した動作により、怒り度合いの印象が上がる効果を検証できた。GANに基づいた上半身・手振り動作の確率モデルの研究においては、バリエーションのある人らしい動作が生成できることを確認した。 マルチモーダル情報による対話状況認識においては、マルチモーダル情報(音声、テキスト、表情、手振りなど)によって、深層学習による感情認識モデルを提案・検証してきた。GATによるアテンションモデルや3次元骨格運動の導入法を提案し、感情クラス(怒り、喜び、悲しみ、平常)の識別率を向上することを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
論文誌6件および国際会議発表4件、予定以上の成果が得られたため。 また、そうちの1件は、国際会議APSIPAにてBestPaperAwardを受賞した。
|
Strategy for Future Research Activity |
今後は以下に記すように、それぞれの課題に対して発展させる予定である。 指示ジェスチャの種類と対人関係による使い分けにおける分析結果は相手や状況によるロボットの適切な振る舞いの生成に今後活用する。 怒り・不満・不快などのネガティブな感情・態度表出においては、この振る舞いにより、マスク着用の強要など、ロボットが怒りながら注意すべき状況における効果を調べている。 GANに基づいた上半身・手振り動作の確率モデルの研究においては、WGANによる学習の方が効果的であることを検証している。今後は、状況依存のconditionについて検討する予定である。対話状況に合わせた複数人対話の視線制御おいては、人同士の3者対話の視線分析により、対話における話者の役割(話し手、メインの聞き手、サブの聞き手)によって、ターンの変更がある時点の前後の視線の動きの分布を分析し、黒目と頭部の動きも考慮して、ロボット(CommU)の視線制御モデルを構築した。今後は、外部刺激(物音や光など)や個人差についてより詳細なモデルに拡張する予定である。 マルチモーダル情報による対話状況認識においては、これらの認識技術を人ロボットインタラクションに応用し、ロボット適切な表出の判断に活かす予定である。
|
Research Products
(13 results)