研究課題/領域番号 |
10480083
|
研究種目 |
基盤研究(B)
|
研究機関 | 早稲田大学 |
研究代表者 |
白井 克彦 早稲田大学, 理工学部, 教授 (10063702)
|
研究分担者 |
大川 茂樹 千葉工業大学, 情報ネットワーク学科, 助教授 (40306395)
山崎 芳男 早稲田大学, 理工学総合研究センター, 教授 (10257199)
橋本 周司 早稲田大学, 理工学部, 教授 (60063806)
小林 哲則 早稲田大学, 理工学部, 教授 (30162001)
|
キーワード | マルチモーダル / 音声対話システム / 対話制御 / ジェスチャ認識 / 隠れマルコフモデル / 顔方向認識 / 複数話者 / 対話コーバス |
研究概要 |
人間同士のマルチモーダルコミュニケーションの統合理解・生成モデルを明確にするために、マルチモーダルコミュニケーションシステムを試作、それを用いたマルチモーダル対話データベース作成の準備を行った。 まず、マルチモーダルコミュニケーションの中心的な情報伝達手段である音声のみを入出力とする対話システムのプロトタイプを実装し、10人強の被験者により対話データ収集および評価を行った。対話データ収集時には、システムの対話制御を多様に変化させ、システムの応答戦略毎の対話データを収集した。また、収集時のシステム評価の他に数日後の対話聴取評価を行った。その結果、両方の評価結果には高い相関が見られ、システム構築にあたり対話の聴取評価が有効であることがわかった。 その他、収集したマルチモーダル対話データベースの対話を対象に、人間同士の対話に頻出する「つなぎ語」や「割り込み」の音響的特徴分析を行った。その結果、両方の現象の検出にパワー値や0次ケプストラムが有効であることがわかった。 また、ジェスチャ認識アルゴリズムの高精度化を目指し、確率過程モデルを精密に表現する部分隠れマルコフモデルを提案、ジェスチャ認識実験を行ったところ、従来手法より認識率が4.5%上昇することを確認した。 その他、処理性能に応じた対話制御、顔方向認識と顔領域抽出、複数話者による対話音声認識などを目的としたアルゴリズムの基礎的検討およびそのためのデータ収集などを行った。
|