2012 Fiscal Year Research-status Report
騒音環境下での音声認識を目指した体内伝導音計測に基づく音声信号抽出法
Project/Area Number |
24560529
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Prefectural University of Hiroshima |
Principal Investigator |
生田 顯 県立広島大学, 経営情報学部, 教授 (30145164)
|
Co-Investigator(Kenkyū-buntansha) |
折本 寿子(益池寿子) 県立広島大学, 経営情報学部, 講師 (80533207)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 音声信号 / 雑音除去 / 体内伝導音 / 実環境 / 音声認識 |
Research Abstract |
工場など生産の現場における施設・設備巡回点検修理業務や工事現場の記録・状況報告などハンズフリー業務の支援に音声認識を応用することを目的とし、周囲環境からの騒音存在下での音声信号抽出技術に関し新たな手法を開発した。具体的には、周囲騒音の影響を受けにくい体内伝導音(声帯で発生した音声が骨など体内を伝搬し、喉など身体表面で測定される振動)の計測に基づき音声信号を抽出するための信号処理法について検討を行った。 実環境下での音声認識を可能にするためには、雑音変動のガウス性や白色性などの前提を必要とせず、しかも信号に関する高次の非線形相関情報をも考慮した新たな音声信号抽出法を研究開発する必要がある。したがって、騒音変動の非ガウス性や非白色性を考慮し、しかも騒音の統計情報が未知でかつ音声の時間的変動形態が未知の場合でも適用できる騒音除去法を提案した。 一方、実環境での計測においては、振幅変動の有限性や計測器のダイナッミクレンジにも基づいて、現実に摂取できる信頼性のある振幅レベルの変動範囲としては、有限のレベル範囲内に限定された情報であるのが通常であり、また、分解能を上げて精密な測定を行う場合は、レコーダのダイナッミクレンジをあえて狭く設定することもしばしばであることに留意した。すなわち、騒音混入下での音声信号に対する観測データに基づき、音声信号のみを推定するための信号処理法を、信号や観測値の有限振幅変動に整合したベータ分布を重みとする直交展開型分布表現を導入することにより提案した。 さらに、騒音環境下での音声観測値と体内伝導音を同時計測し、LMS適応アルゴリズムを適用することにより、鮮明な音声信号を抽出するための新たなアルゴリズムを研究開発した。今後、実音声データに適用することにより有効性と問題点について検討する。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」に記載したように、次の研究成果が得られた。 1.雑音変動のガウス性や白色性などの前提を必要とせず、かつ音声の時間的変動形態が未知の場合でも適用できる新たな音声信号抽出法を研究開発した。具体的には、確率のベイズ定理に級数展開表現による非線形の音声時系列モデルを組み入れることにより、雑音の影響を抑制し高精度で音声信号を抽出するための新たなアルゴリズムを開発した。 2.騒音混入下での音声信号に対する観測データに基づき、音声信号のみを推定するための信号処理法を、信号や観測値の有限振幅変動に整合したベータ分布を重みとする直交展開型分布表現を導入することにより提案した。 3.騒音環境下での音声観測値と体内伝導音を同時計測し、LMS適応アルゴリズムを適用することにより、鮮明な音声信号を抽出するための新たなアルゴリズムを研究開発した。さらに、ボルテラ級数など非線形モデルを用いた適応アルゴリズムへの拡張について検討した。 1については国内外の学会で発表することにより公表した。2については、国内外の学会で発表した後、専門の学術誌への論文投稿を計画している。3については、まず国内の学会で発表すべく準備を進めている。
|
Strategy for Future Research Activity |
平成24年度に得られた結果を基にして、提案した音声信号抽出アルゴリズムの有効性確認を行う。具体的には、騒音存在下での実環境で有効な音声認識システムを構築するためには、さまざまな条件下で正確なデータが入手できるよう、無響室における音声データおよび体内伝導音を測定・分析する必要がある。実際の音声および体内伝導音データを各種の雑音下で計測し、SN比や音声信号、体内伝導音の統計量など各種パラメータを種々、変更したときの音声信号の推定精度について整理・分類し、音声信号抽出法開発のための基礎的データを蓄積する。特に、アルゴリズムの適用可能範囲についての検討を、実データをもとに詳細に行う。 さらに、音声認識率のさらなる向上や工場等の生産の現場への応用が可能となる音声認識システムを構築し、実用化を計るために、平成24年度に研究開発した体内伝導音計測に基づく音声信号抽出法を、実際の騒音下における音声データに適用し、その実際的有効性を確認する。
|
Expenditure Plans for the Next FY Research Funding |
平成25年度では、音声信号抽出アルゴリズムの有効性を実験的に確認する。研究開発した信号抽出法の有効性を実証するために、簡易無響室において実験を行う予定である。実際の騒音環境下で抽出された音声信号および体内伝導音に対し、音声信号抽出に関する実験を繰り返し行い、性能評価を行う。現場での音声抽出実験を行うためのフィールドモバイルパソコンや関連の附属品を購入の予定である。また、実験補助やデータ整理のための謝金が必要である。さらに、昨年度の研究成果の一部を、7月および9月にバンコクおよびインスブルックで開催される音響関係の国際会議で発表することが決定しており、そのための旅費に使用する。その他、国内外の学会で発表し情報収集を行うための旅費・参加費や投稿中の論文別刷り料金(掲載決定後)が必要となる予定である。
|
Research Products
(8 results)