研究分担者 |
榑松 明 早稲田大学, 理工学術院, 教授 (90251701)
誉田 雅彰 早稲田大学, スポーツ科学学術院, 教授 (90367095)
小林 哲則 早稲田大学, 理工学術院, 教授 (30162001)
菊池 英明 早稲田大学, 人間科学学術院, 助教授 (70308261)
大川 茂樹 千葉工業大学, 情報科学部, 助教授 (40306395)
|
研究概要 |
本研究は,対話を自発的に開始・継続・終了する対話システムの構築を目的としている. その実現には,システム側から能動的にインタラクションを行う機構が必要であり,具体的には,(1)対話状況・環境把握の技術,(2)自発的コミュニケーション制御モデル,(3)音声の生成と動作表現の技術という3種類の技術の確立が求められる. まず,(1)に関しては,環境雑音やBGMの中から,音声を検出する技術の研究を行った.音響信号をspectral sequenceという単位へ分解することにより実現する.本年は特に,spectral sequence抽出に必要なspectral tracking技術を発展させた.また,対話の開始タイミングを諮るため,対話対象者の画像情報から話しかけてよいか否かを判断する,話しかけ判断モデルの検討を行った.画像特徴量は首の付け根・背中・腰・肩・肘・手首・手の甲の3次元座標から抽出した間接の角度,角速度を用いた.識別器にはGMMを用い,フレーム単位で75%程度の正解認識率を得た. (2)に関しては,対話継続のためのコミュニケーションモデルの検討を行った.本研究で想定している対話タスクにおいては,インタビュー形式の対話が必要であり,これは従来のタスク遂行型対話と異なり,ユーザがシステムからの質問内容に関して自由に発話するところが異なる.本年は,ユーザにいかに多くの情報を発話させるかを評価基準にして,インタビュー対話に有効なロボットの非言語情報の分析を行った.その結果,言葉による相づちと動作による首のうなずき,かしげが有効であることが分かった. (3)に関しては,機械による感情表現を目的として,音声の感情表現である笑い声の分析と合成方法の検討を行っている.本年は笑い声の中でも,特に喋り笑いの分析と合成を行い,通常の音声を喋り笑いに変換する方法を提案した.
|