• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

高い雑音下での単語認識のための実時間読唇システムの構成に関する研究

研究課題

研究課題/領域番号 12650427
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 計測工学
研究機関鳥取大学

研究代表者

菅原 一孔  鳥取大学, 工学部・電気電子工学科, 助教授 (90149948)

研究分担者 小西 亮介  鳥取大学, 工学部・電気電子工学科, 教授 (00032269)
研究期間 (年度) 2000 – 2001
研究課題ステータス 完了 (2001年度)
配分額 *注記
3,400千円 (直接経費: 3,400千円)
2001年度: 1,200千円 (直接経費: 1,200千円)
2000年度: 2,200千円 (直接経費: 2,200千円)
キーワード読唇 / 単語認識 / 雑音環境下 / FPGA / 音声認識 / 唇形状の時間変化 / 動的輪郭モデル / 隠れマルニフモデル / 隠れマルコフモデル
研究概要

ロボット技術が進展するにつれ,これまでのようにあらかじめ定められた作業行程のみを機械が単独に繰り返し行うのではなく,人の指示を受けながら人が行う作業を補助する働きをするものが大変有効であることが認識されつつある.このような際の人とロボットが行う情報交換の手段にはいくつかの方法が考えられるが,そのなかでも言葉を利用することは,人にとって特に訓練を行わなくてもよいことや,特別な道具を利用しなくてもよいことなどの点から大変有効な手段であることがわかる.
この点音声認識に関する研究は,従来から各所で盛んに行われているが,ロボットの利用を必要とする場面のように周囲の雑音が大変大きい環境では,十分に音声を認識できないという基本的な問題がいまだに解決できていない.本研究計画では,このような高雑音環境下での単語認識を実現する1つの手段として,視覚情報である唇の動きを実時間で取り込みながらそれを認識することにより,人が発する単語の認識を行うことを考える,これは人がいわゆる「読唇」によって,ある程度言葉を理解できることを考えれば実現性のある方法といえる.この方法によると周囲の雑音に影響されない単語認識システムを構築することができるだけでなく,先に述べたような人にとって特別な訓練や道具を必要としない柔軟なヒューマン・マシンインターフェイスを実現することができる.
本研究計画期間内には,上で述べた唇の動きから単語を認識するシステムを構築する.初年度は,人の発話中の顔画像を実時間で取り込み,それから唇の動きを抽出する手法について検討し,そのハードウエア化を試みた.開発を試みたハードウエアはFPGAと呼ばれる内部構造を自由に設計できる集積回路を中心に,プリント基板上に実現するものとした.FPGA中には動的輪郭モデルとよばれる,画像の輪郭を高速に抽出することができる回路を実現し,その結果現状では試作ではあるが画像1枚あたり平均で3ミリ秒で処理することができた.これは日本で標準のNTSCと呼ばれるビデオ信号の規格で定められるフレーム間の間隔が33ミリ秒であることを考えると,大変高速であり実時間処理ができることが実証された.2年目は初年度の研究結果に基づき,高い雑音下でも正確に人の発話を検出できるよう,唇の動きの変化を捉えることによる発話区間の自動抽出手法について検討した.続いて,発話中の唇の動きを表現する各種のパラメータについて考察を加えた後,それを用いた認識手法を確立し,最後にこれらの技術を総合して実時間読唇システムの構築を試みた.その結果,特定の話者ではあるが,目的とする読唇システムを構築できた.
今後は本研究成果をもとに,より実環境に近い環境で利用できるシステムの開発が望まれる.

報告書

(3件)
  • 2001 実績報告書   研究成果報告書概要
  • 2000 実績報告書
  • 研究成果

    (15件)

すべて その他

すべて 文献書誌 (15件)

  • [文献書誌] 菅原一孔: "パーソナルコンピュータ上での読唇システムの実時間実現"計測自動制御学会論文誌. 36・12. 1145-1151 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA: "Personal Computer Based Real Time Lip Reading System"2000 5th.Int.Conf. Signal Processing. 1341-1346 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] 菅原一孔: "画像情報を取り入れた単語認識システムの実時間実現"電子情報通信学会技術研究報告. PRMU99-269. 57-63 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] 垣田直士: "色情報による唇領域の抽出について"電子情報通信学会技術研究報告. DSP2001-83. 17-22 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] 鷲尾昌宣: "動画像処理を目指した動的輪郭モデルのハードウェア化について"電子情報通信学会技術研究報告. DSP2001-83. 23-30 (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA, Toshimi SHINCHI, Makoto KISHINO, Ryosuke, KONISHI: "Real time Realization of Lip Reading System on the Personal Computer"Transactions of information processing society of Japan. Vol. 36, No. 12. 1145-1151 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA, Makoto KISHINO, Ryosuke KONISHI: "Personal Computer Based Real Time Lip Reading System"Proceedings of 5th International Conference on Signal Processing Proceedings. 1341-1346 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA, Masanobu WASHIO, Makoto KISHINO, Ryosuke KONISHI: "Real time realization of word recognition system based on voice and lip movement information"Technical report of the institute of electronics, information and communication engineers. Vol. PRMU99-269. 57-63 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Naoshi KAKITA, Kazunori SUGAHARA, Ryosuke KONISHI: "On the Lip Area Extraction Method based on the Color Information"Technical report of the institute of electronics, information and communication engineers. Vol. DSP2001-83. 17-22 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] Masanobu WASHIO, Yasuo ANNO, Kazunori SUGAHARA, Ryosuke KONISHI: "Hardware Realization of Active Contour Model for Real Time Video Image Processing"Technical report of the institute of electronics, information and communication engineers. Vol. DSP2001-83. 23-30 (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2001 研究成果報告書概要
  • [文献書誌] 垣田直士: "色情報による唇領域の抽出について"電子情報通信学会技術研究報告. DSP2001-83. 17-22 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 鷲尾昌宣: "動画像処理を目指した動的輪郭モデルのハードウェア化について"電子情報通信学会技術研究報告. DSP2001-83. 23-30 (2001)

    • 関連する報告書
      2001 実績報告書
  • [文献書誌] 菅原一孔: "パーソナルコンピュータ上での読唇システムの実時間実現"計測自動制御学会論文誌. 36. 1145-1151 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Kazunori SUGAHARA: "Personal Computer Based Real Time Lip Reading System"2000 5th.Int.Conf.Signal Processing. 1341-1346 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 菅原一孔: "画像情報を取り入れた単語認識システムの実時間実現"電子情報通信学会技術研究報告. PRMU-269. 57-63 (2000)

    • 関連する報告書
      2000 実績報告書

URL: 

公開日: 2000-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi