• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

騒音環境下での音声認識を目指した体内伝導音計測に基づく音声信号抽出法

Research Project

Project/Area Number 24560529
Research InstitutionPrefectural University of Hiroshima

Principal Investigator

生田 顯  県立広島大学, 経営情報学部, 教授 (30145164)

Co-Investigator(Kenkyū-buntansha) 折本 寿子 (益池 寿子)  県立広島大学, 経営情報学部, 講師 (80533207)
Keywords音声信号 / 雑音除去 / 体内伝導音 / 気導音 / 実環境 / 音声認識
Research Abstract

工場など生産の現場における施設・設備巡回点検修理業務や工事現場の記録・状況報告などハンズフリー業務の支援に音声認識を応用することを目的とし、周囲環境からの騒音存在下での音声信号抽出技術に関し、新たな信号処理法を開発した。本研究では、周囲騒音の影響を受けにくい体内伝導音(声帯で発生した音声が骨など体内を伝搬し、喉など身体表面で測定される振動)の計測に基づき音声信号を抽出するための信号処理法について検討を行っている。
具体的には、実環境下での音声認識を可能にするために、マイクロホンで測定される周囲環境騒音が混入した気導音と、騒音の影響を受けにくい体内伝導音を同時に用いた新たなノイズキャンセラーを本年度に開発した。すなわち、気導音をプライマリー信号、体内伝導音を参照信号とし、最小二乗規範(LMS)による線形適応ノイズキャンセラーを提案した。この手法では、騒音をかなり抑制し音質を大きく改善するが、音声信号の高周波成分の復元には不十分であることが実験により確認された。その理由は、体内伝導音から気導音までの物理的なシステム特性には非線形性が含まれていることに起因する。
以上の観点から、次に、非線形適応フィルタとして学習が容易で性能も良好とされるFunctional Link Artificial Neural Network(FLANN)を用いた、騒音除去のための新たな信号処理法を提案した。さらに、無響室で測定した騒音環境下での気導音と体内伝導音に、提案した手法を適用することにより、提案法の有効性を実験的にも確認した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

1.雑音変動のガウス性や白色性などの前提を必要とせず、かつ音声の時間的変動形態が未知の場合でも適用できる新たな音声信号抽出法を研究開発した。具体的には、確率のベイズ定理に級数展開表現による非線形の音声時系列モデルを組み入れることにより、雑音の影響を抑制し高精度で音声信号を抽出するための新たなアルゴリズムを開発した。
2.騒音混入下での音声信号に対する観測データに基づき、音声信号のみを推定するための信号処理法を、信号や観測値の有限振幅変動に整合したベータ分布を重みとする直交展開型分布表現を導入することにより提案した。
3.騒音環境下での音声観測値(気導音)と体内伝導音を同時計測し、LMS適応アルゴリズムを適用することにより、鮮明な音声信号を抽出するための線形適応ノイズキャンセラーを研究開発した。次に、実システムの非線形性に対処するため、FLNNを用いた適応アルゴリズムに基づくノイズキャンセラーを提案した。さらに、提案した音声信号抽出アルゴリズムの有効性確認を行った。具体的には、騒音存在下での実環境で有効な音声認識システムを構築するために、さまざまな条件下で正確なデータが入手できるよう、無響室における音声データおよび体内伝導音を測定・分析した。実際の音声(気導音)および体内伝導音データを各種の雑音下で計測し、SN比や音声信号を種々、変更したときの音声信号の推定精度について整理・分類し、音声信号抽出法開発のための基礎的データを蓄積した。特に、アルゴリズムの適用可能範囲についての検討を、実データをもとに詳細に行った。
1については国際会議で発表することにより公表した。2については、国際会議で一部発表した後、新たな理論的考察と実験を追加した研究について、専門の学術誌に投稿し掲載決定済である。3については国内の学会で発表した。

Strategy for Future Research Activity

平成25年度に開発した体内伝導音と気導音の両者を利用した環境騒音除去のための信号処理法に対し、実環境における不確実性や非線形性に対処するため、確率論を導入することにより、より高精度に音声信号を抽出できるよう方法論の精密化を図る。具体的には、現実の体内伝導音計測においては、高周波域における減衰の影響が無視できず、音声認識率のさらなる向上を目指し、音声時系列モデルにおいて、(高周波と結びつく)より高次の相関情報を考慮することにより、提案した音声信号抽出法の適用可能性の拡大について検討を行う。通常の確定論でなく確率論にもとづく本手法は、音場の不確実性に対しても柔軟に対応可能であり、その有効性が期待される。
さらに、開発・改良した音声信号抽出法を、再度、実際の現場へ適用し実用化への検討を行う。具体的には、音声認識が必要とされる両手作業・狭い場所・暗い場所などペーパー使用不可能な状況における作業記録・情報伝達において、作業の安全性や効率性に関連する、ユーザの明瞭度評価や了解度評価を行い実用化における問題点の解決を図る。

Expenditure Plans for the Next FY Research Funding

平成26年度では、確率論を導入することにより方法論の精密化を図ると同時に、音声信号抽出アルゴリズムの有効性を実験的に確認する。実際の騒音環境下で測定された音声信号および体内伝導音に対し音声信号抽出に関する実験を繰り返し行い、性能評価を行う。したがって、これらの実験を新たに実施するための実験機器等に関する費用が必要になる。
騒音環境下における音声信号の計測のために、騒音源としてのファンクション・ジェネレータ、アンプ、スピーカーや関連の附属品を購入する予定である。また、実験補助やデータ整理のための謝金が必要である。さらに、昨年度の研究成果の一部を、8月に北京で開催される音響関係の国際会議で発表することが決定しており、そのための旅費に使用する。その他、国内外の学会で発表し情報収集を行うための旅費・参加費や投稿中の論文別刷り料金(掲載決定後)が必要となる。

  • Research Products

    (13 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (11 results) (of which Invited: 1 results)

  • [Journal Article] Prediction of Output Response Probability of Sound Environment System Using Simplified Model with Stochastic Regression and Fuzzy Inference2013

    • Author(s)
      A. Ikuta, N. H. Siddique and H. Orimoto
    • Journal Title

      Fuzzy Information and Engineering

      Volume: 11 Pages: 173-190

    • DOI

      10.1007/s12543-013-0142-4

    • Peer Reviewed
  • [Journal Article] Detection of Machine Failure by Using Information on Higher-Order Correlations Between Sound and Vibration2013

    • Author(s)
      A. Ikuta, H. Orimoto and H. Ogawa
    • Journal Title

      Electronics and Communications in Japan

      Volume: 96 Pages: 50-59

    • Peer Reviewed
  • [Presentation] Estimation of Correlation Information and Prediction of Response Probability Distribution in Decibel Evaluation and Energy Observation2014

    • Author(s)
      A. Ikuta
    • Organizer
      The 21th International Congress on Sound and Vibration
    • Place of Presentation
      Beijing, China
    • Year and Date
      20140713-20140717
  • [Presentation] 骨導音と気導音を用いた非線形適応ノイズキャンセラーによる音声復元2014

    • Author(s)
      生田 顕、肖 業貴、折本寿子、長谷川浩治
    • Organizer
      日本音響学会2014年春季研究発表会
    • Place of Presentation
      日本大学理工学部(東京)
    • Year and Date
      20140310-20140312
  • [Presentation] Signal Processing in Power State Variables for Sound and Electromagnetic Environment by Introducing Fuzzy Probability2014

    • Author(s)
      A. Ikuta and H. Orimoto
    • Organizer
      the 2014 International Conference on Communications, Signal Processing and Computers
    • Place of Presentation
      Interlaken, Switzerland
    • Year and Date
      20140222-20140224
  • [Presentation] Stochastic Modeling of Sound Environment System with Multiplicative Noise and Noise Cancellation Method2014

    • Author(s)
      H. Orimoto and A. Ikuta
    • Organizer
      the 2014 International Conference on Communications, Signal Processing and Computers
    • Place of Presentation
      Interlaken, Switzerland
    • Year and Date
      20140222-20140224
  • [Presentation] FLANNを用いた適応音声処理システム2013

    • Author(s)
      肖 然,生田 顕,肖 業貴,折本寿子
    • Organizer
      計測自動制御学会中国支部
    • Place of Presentation
      山口大学(宇部)
    • Year and Date
      20131130-20131130
  • [Presentation] デシベル評価とエネルギー観測に整合した相関情報推定と応答分布予測2013

    • Author(s)
      生田 顕,折本寿子,小川仁士,肖 業貴
    • Organizer
      電子情報通信学会技術研究報告(応用音響)
    • Place of Presentation
      県立広島大学(広島)
    • Year and Date
      20131114-20131114
  • [Presentation] Stochastic Signal Processing for Cancellation of Additive and Multiplicative Noises in Sound Environment Systems2013

    • Author(s)
      A. Ikuta and H. Orimoto
    • Organizer
      Inter Noise 2013
    • Place of Presentation
      Innsbruck, Austria
    • Year and Date
      20130915-20130918
    • Invited
  • [Presentation] Noise Suppression of Speech Signal by Considering Finite Range of Amplitude Fluctuation in Real Environment2013

    • Author(s)
      A. Ikuta and H. Orimoto
    • Organizer
      Inter Noise 2013
    • Place of Presentation
      Innsbruck, Austria
    • Year and Date
      20130915-20130918
  • [Presentation] Cancellation Method of Additive External Noise and State Dependent Noise in Sound Environment Systems by Use of Stochastic Signal Processing2013

    • Author(s)
      A. Ikuta and S. Arima
    • Organizer
      The 20th International Congress on Sound and Vibration
    • Place of Presentation
      Bangkok, Thailand
    • Year and Date
      20130707-20130711
  • [Presentation] Stochastic Evaluation Method Based on Nonlinear Time Series Regression Model between Sound Pressure Level and Loudness with an Experiment2013

    • Author(s)
      H. Orimoto, A. Ikuta and Y. Xiao
    • Organizer
      The 20th International Congress on Sound and Vibration
    • Place of Presentation
      Bangkok, Thailand
    • Year and Date
      20130707-20130711
  • [Presentation] A Speech Signal Processing Method by Considering Finite Range of Amplitude Fluctuation and Its Application to Actual Environment2013

    • Author(s)
      R. Xiao and A. Ikuta
    • Organizer
      The 20th International Congress on Sound and Vibration
    • Place of Presentation
      Bangkok, Thailand
    • Year and Date
      20130707-20130711

URL: 

Published: 2015-05-28   Modified: 2015-06-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi