研究課題/領域番号 |
08458078
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 京都大学 |
研究代表者 |
堂下 修司 京都大学, 工学研究科, 教授 (00025925)
|
研究分担者 |
荒木 雅弘 京都大学, 総合情報メディアセンター, 講師 (50252490)
河原 達也 京都大学, 工学研究科, 助教授 (00234104)
|
研究期間 (年度) |
1996 – 1997
|
研究課題ステータス |
完了 (1997年度)
|
配分額 *注記 |
7,300千円 (直接経費: 7,300千円)
1997年度: 1,800千円 (直接経費: 1,800千円)
1996年度: 5,500千円 (直接経費: 5,500千円)
|
キーワード | マルチモーダルコミュニケーション / 対話 / 音声認識 / ジェスチャ / 作図システム / 情報統合 |
研究概要 |
本研究では、音声言語入力による作図システムの実現を通じて、人と機械とのマルチモーダルコミュニケーションを実現することを目標とし、本年度は以下にあげるような研究成果を得た。 1.音声・指示ジェスチャ・図像情報の統合 複数モード入力に対して、時間的な同期性を仮定せずに対応付けをすることができる柔軟なモード統合手法を開発し、その有効性をマルチモーダルディクテーションシステムにおける情報伝達の信頼性向上によって評価した。 2.作図システムにおける音声・マウス指示を用いたマルチモーダルインタフェースの実現 上記統合手法に加え、信頼できるマウス指示の認識結果を音声認識における制約として用いる手法を開発した。この制約利用によって、音声の認識率に6%の向上が見られた。また、これらの技術を統合したマルチモーダル作図システムを実現した。 3.マルチモーダル作図システムにおける図像情報と文脈情報を利用した発話解釈 上記マルチモーダル作図システムにおいて、自然な音声発話(省略や参照、指示語や指示動作による曖昧性を含む指示)を解析するために、スタックによる文脈情報管理機構を実現し、マルチモーダル作図システムに組み込んだ。
|