1996 Fiscal Year Annual Research Report
仮想空間との音声言語によるコミュニケーションに関する研究
Project/Area Number |
08234214
|
Research Institution | Kyoto University |
Principal Investigator |
河原 達也 京都大学, 工学研究科, 助教授 (00234104)
|
Co-Investigator(Kenkyū-buntansha) |
堂下 修司 京都大学, 工学研究科, 教授 (00025925)
荒木 雅弘 京都大学, 工学研究科, 助手 (50252490)
|
Keywords | 仮想空間 / 仮想現実感 / 音声対話 / 音声認識 / 画像認識 / マルチモーダル / ヒューマンインターフェース |
Research Abstract |
仮想空間との対話において音声言語を利用できるようにすることは、自然で知的なインタフェイスのために重要と考えられる。そこで本研究では、仮想空間との音声対話インタフェイスによる効果的な相互作用の実現を探求した。仮想空間とのコミュニケーションにおいて、(1)音声言語でないとできない指示・操作、及び(2)音声言語を用いることにより円滑になる指示・操作に分類して、考察した。 上記の考察に基づいて、音声言語が効果的に作用するタスクとして、仮想試着システムを設計した。具体的には、試着室にいるような状況を設定し、自分の希望のデザインを指示・選択し、それを仮想の鏡において試着したイメージを合成する。仮想店舗では、実空間では不可能な膨大なストックを用意し、瞬時に“着替える"ことが可能である。本タスクは、できれば両手を使いたくないような状況で、仮想的なストックの中のものへ、属性や感性的な指示を行うことによりアクセスする操作を基本としており、音声言語の利点が有効に働くと考えられる。本システムは、音声認識部・対話管理部・画像認識部・画像合成部からなり、ワークステーション上でプロトタイプの実装が完了した。
|
-
[Publications] 河原達也: "A^*探索に基づいたフレーズスポッティングによる頑健な音声理解" 電子情報通信学会論文誌. J79-DII. 1187-1194 (1996)
-
[Publications] 前田茂則: "顔画像特徴,歩行画像特徴および音声特徴の統合による個人識別" 電子情報通信学会論文誌. J79-DII. 600-607 (1996)
-
[Publications] T.Kawahara: "Concept-based phrase spotting approach for spontaneous speech understanding" Proc.IEEE Int'l Conf.Acoust.,Speech & Signal Process.1. 291-294 (1996)
-
[Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" Proc.Int'l Conf.on Spoken Language Processing. 2. 681-684 (1996)
-
[Publications] 堂下修司: "音声・言語・概念の統合的処理による対話の理解と生成" 人工知能学会誌. Vol.12,No1. 3-12 (1997)
-
[Publications] S.Doshita: "Understanding and Generating Dialogue by Integrating Processing of Speech,Language and Concept" Proc.of Int'l Sympo.Spoken Dialogue. 1-8 (1996)