研究課題/領域番号 |
17300066
|
研究機関 | 早稲田大学 |
研究代表者 |
白井 克彦 早稲田大学, 理工学術院, 教授 (10063702)
|
研究分担者 |
榑松 明 早稲田大学, 理工学術院, 教授 (90251701)
誉田 雅彰 早稲田大学, スポーツ科学学術院, 教授 (90367095)
小林 哲則 早稲田大学, 理工学術院, 教授 (30162001)
菊池 英明 早稲田大学, 人間科学学術院, 助教授 (70308261)
大川 茂樹 千葉工業大学, 情報科学部, 助教授 (40306395)
|
キーワード | ロボット / 音声認識 / 感情発話 / 笑い声 / 音声対話 / 単語共起情報 / 動画像認識 / 人物姿勢認識 |
研究概要 |
本研究では、ユーザやシステムの状況に応じ自発的コミュニケーションを行うシステムの構築を目的として研究を行っている。 まず、状況把握技術の研究としては、音響情報を用いたものと画像情報を用いたものの2種類の研究を行っている。音響情報では、音カテゴリの識別技術として、音声と音楽の混合信号中から両者を検出して識別する手法を提案し、その有効性を示した。また、音声中から、感情表現、特に笑い声を検出する技術の研究を行い、識別器にHMM、特徴料としてスペクトル包絡とFO成分を用いた手法を提案した。画像情報では、人物の動画像情報からその姿勢を識別する技術の研究を行った。ステレオカメラから取得した3次元の座標情報を用いることにより、従来より頑健な姿勢認識手法の提案を行った。 提案システムの動作フェイズの一つとして、システムがユーザの状況を判断して対話を開始する局面が挙げられるが、ユーザフレンドリなシステムとしてその機能を実現するためには、画像情報から、ユーザが暇である、忙しいなどの状況を判断し、現在話しかけが行えるか否かを判断するための「状況判断モデル」の構築が必要である。そこで、本年度は、オフィスで作業する人物映像の視聴取実験を行い、人間はどのような要因から相手の状況を判断するのかを調べ、人物動作と状況判断の関係を明らかにした。また、システムの別の動作フェイズとして、ユーザとシステムが対話を行い、その対話を継続することでユーザから有用な情報を取得する局面が挙げられる。ユーザとの会話を継続するためには、ユーザを不快にさせない範囲での確認応答の生成が有効である。そのためには音声認識結果に対する信頼度の利用が有効だが、従来の音響モデル、言語モデルの利用に加え、対話の発話間の単語共起情報を用いることで信頼度の精度向上を図り、その有効性を示した。
|