• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

高い雑音下での画像情報を併用した音声認識手法に関する研究

研究課題

研究課題/領域番号 11650426
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 計測工学
研究機関鳥取大学

研究代表者

小西 亮介  鳥取大学, 工学部・電気電子工学科, 教授 (00032269)

研究分担者 菅原 一孔  鳥取大学, 工学部・電気電子工学科, 助教授 (90149948)
研究期間 (年度) 1999 – 2000
研究課題ステータス 完了 (2000年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2000年度: 1,200千円 (直接経費: 1,200千円)
1999年度: 2,100千円 (直接経費: 2,100千円)
キーワード音声認識 / 唇形状の時間変化 / 隠れマルコフモデル / 動的輪郭モデル / 高雑音環境 / 唇形状抽出 / HMM
研究概要

音声認識に関する研究は各所で盛んに行われており,現在では不特定な話者が発する言葉を高い確率で認識するシステムについても報告がなされている.しかし実環境では周囲に雑音が存在するため,その影響を受け認識率は大幅に低下してしまう.これを解決する1つの手段として,唇の動きを視覚情報として取り込むことにより,音声の認識を援助することが可能であると考えられる.これらは耳の不自由な人が「唇読法」によって言葉を理解していることを考えれば納得できる.このように唇の動きを実時間で抽出し,視覚情報として音声情報と併用して音声の認識を行う技術を確立することは重要であるが,未だに確立されているとは言い難い状況にある.
人の顔の情報を画像として取り込み,これを補助的な情報として用いることで,より正確な音声認識を行う手法について検討することを目的とする.先に述べたように音声認識を行う技術そのものは比較的研究が進んでいる.しかし本研究計画で目的としている高い雑音環境下では十分な認識率を得ることができない.これは雑音中からの認識対象の音声の抽出手法や話者適応化の技術などの基礎的な技術が十分確立されていないことも大きな理由の一つである.本研究計画では,音声データからだけでは良好な成果が得られなかったこれらの技術を,視覚情報を積極的に利用することで問題の解決を図った.
本研究計画の特色は,人の顔画像から得られる唇の動きを利用することにより,従来実用化が進まなかった高雑音環境下での音声認識を行う技術を確立しようとする点にある.それに伴い,顔画像から唇などの顔の部分の抽出を,実時間で行う技術を確立することを目指す点も本研究計画の特徴といえる.この点本研究計画では複数の点を結んだ閉曲線によりあらわされる新しい動的輪郭モデルを考案し,顔画像から唇などの領域を連続的に抽出した.また,得られた唇の動きと音声情報とを併用した新しい認識手法の確立を目指す点も本研究計画の特色である.唇の動きに基づく音声認識では,無雑音時の音声情報だけに基づく音声認識ほど高い認識率は得られないが,反面周囲の雑音が音声に重畳された場合でもその影響を受けることはない.この点を考慮して音声情報と視覚情報を併用することで,従来の音声情報だけに基づく音声認識手法では解決できなかった問題を解決した.
今後本研究で得られた成果をもとに,雑踏や工場などの高い雑音環境下におけるロボットなどの機器の制御手法について研究を進めることを検討している.

報告書

(3件)
  • 2000 実績報告書   研究成果報告書概要
  • 1999 実績報告書
  • 研究成果

    (21件)

すべて その他

すべて 文献書誌 (21件)

  • [文献書誌] 菅原一孔: "パーソナルコンピュータ上での読唇システムの実時間実現"計測自動制御学会論文誌. 36. 1145-1151 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA: "Personal Computer Based Real Time Lip Reading System"2000 5th.Int.Conf.Signal Processing. 1341-1346 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 新地俊幹: "画像情報と音声情報を併用した単語認識システムの構築について"電子情報通信学会技術研究報告. CAS98-66. 37-44 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 岸野誠: "画像情報を用いた単語発話区間抽出処理の自動化"第16回センシングフォーラム論文集. 45-50 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 岸野誠: "画像情報を用いた発話区間抽出処理の単語認識システムへの応用"電気学会センサシステム応用技術研究会. 25-30 (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 菅原一孔: "画像情報を取り入れた単語認識システムの実時間実現"電子情報通信学会技術研究報告. PRMU-269. 57-63 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA, Toshimi SHINCHI, Makoto KISHINO, Ryosuke KONISHI: "Real Time Realization of Lip Reading System on the Personal Computer"Transactions of the society of instrument and control engineers. Vol.36, No.12. 1145-1151 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA, Makoto KISHINO, Ryosuke KONISHI: "Personal Computer Based Real Time Lip Reading"2000 5th International Conference on Signal Processing Proceedings Beijing. 1341-1346 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Makoto KISHINO, Masahiro OKI, Tomoyuki OSAKI, Kazunori SUGAHARA, Ryosuke KONISHI: "A Word Spotting Method by Using Image Data"Proceedings of the l6th SICE Sensing Forum. 45-50 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Toshimi SHINCHI, Youichi HAYASHIGUCHI, Makoto KISHINO, Kazunori SUGAHARA, Ryosuke KONISHI: "On the Word Recognition System using Image and Voice Information"Technical report of the institute of electronics, information and communication engineers. Vol.CAS98-66. 37-44 (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Makoto KISHINO, Masahiro OKI, Tomoyuki OSAKI, Kazunori SUGAHARA, Ryosuke KONISHI: "Extraction of Word-Speaking Period by Using Image Data and its Application to Real Time Word Recognition System"Technical report of the institute of electrical engineers of Japan. Vol.PRMU99-269. 57-63 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Kazunori SUGAHARA, Masanobu WASHIO, Makoto KISHINO, Ryosuke KONISHI: "Symbolic circuit analyzing system using network environment"Technical report of the institute of electronics, information and communication engineers. Vol.PRMU99-269. 57-63 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] 菅原一孔: "パーソナルコンピュータ上での読唇システムの実時間実現"計測自動制御学会論文誌. 36. 1145-1151 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Kazunori SUGAHARA: "Personal Computer Based Real Time Lip Reading System"2000 5th.Int.Conf.Signal Processing. 1341-1346 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 新地俊幹: "画像情報と音声情報を併用した単語認識システムの構築について"電子情報通信学会技術研究報告. CAS98-66. 37-44 (1999)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 岸野誠: "画像情報を用いた単語発話区間抽出処理の自動化"第16回センシングフォーラム論文集. 45-50 (1999)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 岸野誠: "画像情報を用いた発話区間抽出処理の単語認識システムへの応用"電気学会センサシステム応用技術研究会. 25-30 (1999)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 菅原一孔: "画像情報を取り入れた単語認識システムの実時間実現"電子情報通信学会技術研究報告. PRMU-269. 57-63 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 岸野誠: "画像情報を用いた単語発話区間抽出処理の自動化"計測自動制御学会第16回センシングフォーラム講演論文集. 45-50 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 岸野誠: "画像情報を用いた単語発話区間抽出処理の単語認識システムへの応用"電気学会センサシステム応用技術研究会資料. 25-30 (1999)

    • 関連する報告書
      1999 実績報告書
  • [文献書誌] 菅原一孔: "画像情報をとり入れた単語認識システムの実時間実現"電子情報通信学会・パターン認識・メディア理解研究会. (発表予定). (2000)

    • 関連する報告書
      1999 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi