• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1998 年度 実績報告書

マルチモーダルコミュニケーションにおける音声とジェスチャの統合についての研究

研究課題

研究課題/領域番号 10480083
研究種目

基盤研究(B)

研究機関早稲田大学

研究代表者

白井 克彦  早稲田大学, 理工学部, 教授 (10063702)

研究分担者 大川 茂樹  千葉工業大学, 情報ネットワーク学科, 助教授 (40306395)
山崎 芳男  早稲田大学, 理工学総合研究センター, 教授 (10257199)
橋本 周司  早稲田大学, 理工学部, 教授 (60063806)
小林 哲則  早稲田大学, 理工学部, 教授 (30162001)
キーワードマルチモーダル / 音声対話システム / 対話制御 / ジェスチャ認識 / 隠れマルコフモデル / 顔方向認識 / 複数話者 / 対話コーバス
研究概要

人間同士のマルチモーダルコミュニケーションの統合理解・生成モデルを明確にするために、マルチモーダルコミュニケーションシステムを試作、それを用いたマルチモーダル対話データベース作成の準備を行った。
まず、マルチモーダルコミュニケーションの中心的な情報伝達手段である音声のみを入出力とする対話システムのプロトタイプを実装し、10人強の被験者により対話データ収集および評価を行った。対話データ収集時には、システムの対話制御を多様に変化させ、システムの応答戦略毎の対話データを収集した。また、収集時のシステム評価の他に数日後の対話聴取評価を行った。その結果、両方の評価結果には高い相関が見られ、システム構築にあたり対話の聴取評価が有効であることがわかった。
その他、収集したマルチモーダル対話データベースの対話を対象に、人間同士の対話に頻出する「つなぎ語」や「割り込み」の音響的特徴分析を行った。その結果、両方の現象の検出にパワー値や0次ケプストラムが有効であることがわかった。
また、ジェスチャ認識アルゴリズムの高精度化を目指し、確率過程モデルを精密に表現する部分隠れマルコフモデルを提案、ジェスチャ認識実験を行ったところ、従来手法より認識率が4.5%上昇することを確認した。
その他、処理性能に応じた対話制御、顔方向認識と顔領域抽出、複数話者による対話音声認識などを目的としたアルゴリズムの基礎的検討およびそのためのデータ収集などを行った。

  • 研究成果

    (6件)

すべて その他

すべて 文献書誌 (6件)

  • [文献書誌] Hideaki Kikuchi Katsuhiko Shirai: "Controlling Gaze of Humanoid in Communication with Human" Proc.Of International conference on Intelligent Robots and Systems. Vol.1. 255-260 (1998)

  • [文献書誌] 横山 真男:白井克彦: "人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御" 情報処理学会 論文誌. 2月号. (1999)

  • [文献書誌] Masao Yokoyama: Katsuhiko Shirai: "Use of Non-Verbal Information in Communication between Human and Robot" Proc.Of International conference on Spoken Language Procesing. 2351-2354 (1998)

  • [文献書誌] Hideaki Kikuchi : Katsuhiko Shirai: "Multimodal Communication Between Human and Robot" Proc.of International Wireless and Telecommunications Symposium. 322-325 (1998)

  • [文献書誌] 益満 健:白井克彦: "部分隠れマルコフモデルとそのジェスチャー認識への応用" 電子情報通信学会 技術研究報告. PRMU97-203. 35-62 (1998)

  • [文献書誌] 田窪 行則:白井 克彦: "岩波書店" 岩波講座 言語の科学 2音声, 249 (1998)

URL: 

公開日: 1999-12-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi