• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1997 年度 研究成果報告書概要

音声言語と図像の統合によるマルチモーダルコミュニケーション方式の研究

研究課題

研究課題/領域番号 08458078
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 知能情報学
研究機関京都大学

研究代表者

堂下 修司  京都大学, 工学研究科, 教授 (00025925)

研究分担者 荒木 雅弘  京都大学, 総合情報メディアセンター, 講師 (50252490)
河原 達也  京都大学, 工学研究科, 助教授 (00234104)
研究期間 (年度) 1996 – 1997
キーワードマルチモーダルコミュニケーション / 対話 / 音声認識 / ジェスチャ / 作図システム / 情報統合
研究概要

本研究では、音声言語入力による作図システムの実現を通じて、人と機械とのマルチモーダルコミュニケーションを実現することを目標とし、本年度は以下にあげるような研究成果を得た。
1.音声・指示ジェスチャ・図像情報の統合
複数モード入力に対して、時間的な同期性を仮定せずに対応付けをすることができる柔軟なモード統合手法を開発し、その有効性をマルチモーダルディクテーションシステムにおける情報伝達の信頼性向上によって評価した。
2.作図システムにおける音声・マウス指示を用いたマルチモーダルインタフェースの実現
上記統合手法に加え、信頼できるマウス指示の認識結果を音声認識における制約として用いる手法を開発した。この制約利用によって、音声の認識率に6%の向上が見られた。また、これらの技術を統合したマルチモーダル作図システムを実現した。
3.マルチモーダル作図システムにおける図像情報と文脈情報を利用した発話解釈
上記マルチモーダル作図システムにおいて、自然な音声発話(省略や参照、指示語や指示動作による曖昧性を含む指示)を解析するために、スタックによる文脈情報管理機構を実現し、マルチモーダル作図システムに組み込んだ。

  • 研究成果

    (16件)

すべて その他

すべて 文献書誌 (16件)

  • [文献書誌] Araki, M.: "Evaluating Dialogue Strategies under Various Communication Errors" Proc.of IJCAI Workshop on Collaboration,Cooperation and Conflict in Dialogue Systems. 13-18 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 荒木 雅弘: "マルチモーダル作図システムにおける文脈知識を利用した会話理解" 人工知能学会研究会資料SIG-SLUD-9703-1. (1998)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 河原 達也: "音声言語を用いた仮想空間との対話による試着システム" 情報処理学会論文誌. 採録決定 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Kawahara, T.: "Speaking-style dependent lexicalized filler model for key-phrase detection and verification" 電子情報通信学会技術研究報告. SP97-78. (1997)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Kawahara, T.: "Combining key-phrase detection and subword-based verification for flexible speech understanding" Proc.of ICASSP97. 1159-1162 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Kawahara, T.: "Phrase language models for detection and verification-based speech understanding" Proc.IEEE Workshop on Automatic Speech Recognition and Understanding. 49-56 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Araki, M.: ""Automatic Evaluation Environment for Spoken Dialogue Systems"in Mayer,E.et al.ed."Dialogue Processing in Spoken Language Systems"" Springer-Verlag, 12 (1997)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] 堂下 修司: "「音声による人間と機械の対話」" オーム社, 383 (1998)

    • 説明
      「研究成果報告書概要(和文)」より
  • [文献書誌] Araki, M.: "Evaluating Dialogue Strategies under Various Communication Errors" Proc.of IJCAI Workshop on Collaboration, Cooperation and Conflict in Dialogue Systems. 13-18 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Araki, M.: "Interpretation of Utterance on Multi-modal Drawing System based on Contextual Knowledge" Tech.report of IJSAI. SIG-SLUD-9703-1. (1998)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Kawahara, T.: "Virtual Fitting Room with Spoken Dialogue Interface" J,of IPSJ. (to appear.).

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Kawahara, T.: "Speaking-style dependent lexicalized filler model for key-phrase detection and verification" Tech.report of IPSJ. SP97-78. (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Kawahara, T.: "Combining key-phrase detection and subword-based verification for flexible speech understanding" Proc.of ICASSP97. 1159-1162 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Kawahara, T.: "Phrase language models for detection and verification-based speech understanding" Proc.IEEE Workshop on Automatic Speech Recognition and Understanding. 49-56 (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Araki, M.: "Automatic Evaluation Environment for Spoken Dialogue Systems" in Mayr, E.et al.ed. "Dialogue Processing in Spoken Language Systems". (1997)

    • 説明
      「研究成果報告書概要(欧文)」より
  • [文献書誌] Doshita, S.: "Human-machine communication by speech" Ohmsha inc.(1998)

    • 説明
      「研究成果報告書概要(欧文)」より

URL: 

公開日: 1999-03-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi