2013 Fiscal Year Research-status Report
騒音環境下での音声認識を目指した体内伝導音計測に基づく音声信号抽出法
Project/Area Number |
24560529
|
Research Institution | Prefectural University of Hiroshima |
Principal Investigator |
生田 顯 県立広島大学, 経営情報学部, 教授 (30145164)
|
Co-Investigator(Kenkyū-buntansha) |
折本 寿子 (益池 寿子) 県立広島大学, 経営情報学部, 講師 (80533207)
|
Keywords | 音声信号 / 雑音除去 / 体内伝導音 / 気導音 / 実環境 / 音声認識 |
Research Abstract |
工場など生産の現場における施設・設備巡回点検修理業務や工事現場の記録・状況報告などハンズフリー業務の支援に音声認識を応用することを目的とし、周囲環境からの騒音存在下での音声信号抽出技術に関し、新たな信号処理法を開発した。本研究では、周囲騒音の影響を受けにくい体内伝導音(声帯で発生した音声が骨など体内を伝搬し、喉など身体表面で測定される振動)の計測に基づき音声信号を抽出するための信号処理法について検討を行っている。 具体的には、実環境下での音声認識を可能にするために、マイクロホンで測定される周囲環境騒音が混入した気導音と、騒音の影響を受けにくい体内伝導音を同時に用いた新たなノイズキャンセラーを本年度に開発した。すなわち、気導音をプライマリー信号、体内伝導音を参照信号とし、最小二乗規範(LMS)による線形適応ノイズキャンセラーを提案した。この手法では、騒音をかなり抑制し音質を大きく改善するが、音声信号の高周波成分の復元には不十分であることが実験により確認された。その理由は、体内伝導音から気導音までの物理的なシステム特性には非線形性が含まれていることに起因する。 以上の観点から、次に、非線形適応フィルタとして学習が容易で性能も良好とされるFunctional Link Artificial Neural Network(FLANN)を用いた、騒音除去のための新たな信号処理法を提案した。さらに、無響室で測定した騒音環境下での気導音と体内伝導音に、提案した手法を適用することにより、提案法の有効性を実験的にも確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
1.雑音変動のガウス性や白色性などの前提を必要とせず、かつ音声の時間的変動形態が未知の場合でも適用できる新たな音声信号抽出法を研究開発した。具体的には、確率のベイズ定理に級数展開表現による非線形の音声時系列モデルを組み入れることにより、雑音の影響を抑制し高精度で音声信号を抽出するための新たなアルゴリズムを開発した。 2.騒音混入下での音声信号に対する観測データに基づき、音声信号のみを推定するための信号処理法を、信号や観測値の有限振幅変動に整合したベータ分布を重みとする直交展開型分布表現を導入することにより提案した。 3.騒音環境下での音声観測値(気導音)と体内伝導音を同時計測し、LMS適応アルゴリズムを適用することにより、鮮明な音声信号を抽出するための線形適応ノイズキャンセラーを研究開発した。次に、実システムの非線形性に対処するため、FLNNを用いた適応アルゴリズムに基づくノイズキャンセラーを提案した。さらに、提案した音声信号抽出アルゴリズムの有効性確認を行った。具体的には、騒音存在下での実環境で有効な音声認識システムを構築するために、さまざまな条件下で正確なデータが入手できるよう、無響室における音声データおよび体内伝導音を測定・分析した。実際の音声(気導音)および体内伝導音データを各種の雑音下で計測し、SN比や音声信号を種々、変更したときの音声信号の推定精度について整理・分類し、音声信号抽出法開発のための基礎的データを蓄積した。特に、アルゴリズムの適用可能範囲についての検討を、実データをもとに詳細に行った。 1については国際会議で発表することにより公表した。2については、国際会議で一部発表した後、新たな理論的考察と実験を追加した研究について、専門の学術誌に投稿し掲載決定済である。3については国内の学会で発表した。
|
Strategy for Future Research Activity |
平成25年度に開発した体内伝導音と気導音の両者を利用した環境騒音除去のための信号処理法に対し、実環境における不確実性や非線形性に対処するため、確率論を導入することにより、より高精度に音声信号を抽出できるよう方法論の精密化を図る。具体的には、現実の体内伝導音計測においては、高周波域における減衰の影響が無視できず、音声認識率のさらなる向上を目指し、音声時系列モデルにおいて、(高周波と結びつく)より高次の相関情報を考慮することにより、提案した音声信号抽出法の適用可能性の拡大について検討を行う。通常の確定論でなく確率論にもとづく本手法は、音場の不確実性に対しても柔軟に対応可能であり、その有効性が期待される。 さらに、開発・改良した音声信号抽出法を、再度、実際の現場へ適用し実用化への検討を行う。具体的には、音声認識が必要とされる両手作業・狭い場所・暗い場所などペーパー使用不可能な状況における作業記録・情報伝達において、作業の安全性や効率性に関連する、ユーザの明瞭度評価や了解度評価を行い実用化における問題点の解決を図る。
|
Expenditure Plans for the Next FY Research Funding |
平成26年度では、確率論を導入することにより方法論の精密化を図ると同時に、音声信号抽出アルゴリズムの有効性を実験的に確認する。実際の騒音環境下で測定された音声信号および体内伝導音に対し音声信号抽出に関する実験を繰り返し行い、性能評価を行う。したがって、これらの実験を新たに実施するための実験機器等に関する費用が必要になる。 騒音環境下における音声信号の計測のために、騒音源としてのファンクション・ジェネレータ、アンプ、スピーカーや関連の附属品を購入する予定である。また、実験補助やデータ整理のための謝金が必要である。さらに、昨年度の研究成果の一部を、8月に北京で開催される音響関係の国際会議で発表することが決定しており、そのための旅費に使用する。その他、国内外の学会で発表し情報収集を行うための旅費・参加費や投稿中の論文別刷り料金(掲載決定後)が必要となる。
|
Research Products
(13 results)