• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

指示棒と音声を用いるマルチモーダルインターフェイスの認識処理高速化

研究課題

研究課題/領域番号 07780369
研究種目

奨励研究(A)

配分区分補助金
研究分野 情報システム学(含情報図書館学)
研究機関九州工業大学

研究代表者

大橋 健  九州工業大学, 情報工学部, 助手 (00233239)

研究期間 (年度) 1995
研究課題ステータス 完了 (1995年度)
配分額 *注記
800千円 (直接経費: 800千円)
1995年度: 800千円 (直接経費: 800千円)
キーワードヒューマンインターフェイス / マルチモーダルインターフェイス / 情報統合 / 画像処理 / 画像認識 / 音声認識 / 音声抽出
研究概要

本研究は,ユーザが指示棒を音声とを用いてコンピュータとインタラクションを行なうインターフェイス環境を構築するために行なわれた.指示棒の3次元座標は,テレビカメラの映像から画像処理を行い指示棒の画像領域を抽出し,3次元空間中の座標を推定することにより得られる.これらの座標を用いてポインティングバイスとして活用し,音声認識から得られる言語情報と組み合わせることにより使い易いインターフェイスを構築しようというものである.
指示棒と音声を用いたマルチモーダルインターフェイスを構成するにあたり,画像処理による指示棒の認識と音声認識処理の速度と精度の向上が課題であった.画像処理速度の向上に関しては,入力画像をネット-ワークを経由した別の計算機に送付し認識処理を行なうことを試みた.しかしながら画像のデータ量が多く高速のネットワークでないと効果が得られないことが分った.また,画像サイズが小さければ十分ワークステーションでもリアルタイム(一秒間に10コマ程度)処理できるので実用になる範囲と考えられる.
次に音声認識についてであるが,インタラクティブなシステムに活用するためには精度はもちろんレスポンスタイムが短いことが望ましい.このため,認識対象とする単語を限定しパワーをもとに単語に切り出しして認識させることによりソフトウェアのみでも十分許容できる時間内で認識処理できるようになった.また,音声の母音のもつ調波構造とホルマントの特徴を用いて他の背景雑音から抽出することができるようになった.今後はこれを用いて音声認識の評価を行ないたいと考えている.

報告書

(1件)
  • 1995 実績報告書
  • 研究成果

    (3件)

すべて その他

すべて 文献書誌 (3件)

  • [文献書誌] T.Ohashi: "Multimodal interface with Speech and Motion of Stick : CoSMoS" Symbiosis of Human and Artifact,Anzai et al.(Editors),Elsevier. 20A. 207-212 (1995)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 伊藤隆史: "調波構造とホルマントに着目した音声抽出" 情報処理学会九州支部研究会報告. 44-53 (1996)

    • 関連する報告書
      1995 実績報告書
  • [文献書誌] 大橋健: "指示棒を用いた仮想オブジェクト操作" 電子情報通信学会技術報告. MVE95-63. 25-32 (1996)

    • 関連する報告書
      1995 実績報告書

URL: 

公開日: 1995-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi