体内伝導音と音声信号の高次相関情報活用による騒音下でのベイズ推定に基づく信号抽出
Project/Area Number |
19K04428
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 21030:Measurement engineering-related
|
Research Institution | Prefectural University of Hiroshima |
Principal Investigator |
生田 顯 県立広島大学, 経営情報学部, 名誉教授 (30145164)
|
Co-Investigator(Kenkyū-buntansha) |
折本 寿子 (益池寿子) 県立広島大学, 地域創生学部, 教授 (80533207)
|
Project Period (FY) |
2019-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2020: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 音声信号検出 / ベイズ推定 / 気導音 / 周囲環境騒音 / 体内伝導音 / 周囲環境 / 周囲騒音 / 音声信号 / 高次相関情報 / 騒音環境 |
Outline of Research at the Start |
ディジタル情報技術の進展に伴い、音声認識システムが開発され様々な分野で応用されているが、音の存在する実環境下においては認識が困難な場合が多い。本研究では、騒音の混入した気導音の測定に加えて、騒音の影響を受けにくい体内伝導音を活用することにより、音声信号抽出のための手法を提案する。具体的には、音声信号の時系列と体内伝導音との各種相関情報を反映した結合確率分布を用い、非線形の音声時系列モデルを用いることにより、実環境下での音声認識が可能な手法を見出す。本研究は確率論(ベイズ推定)に基づくところに特徴があり、計算の負荷が確定論に比べ大幅に減少することから、音声認識の分野での実用化が期待される。
|
Outline of Annual Research Achievements |
これまで研究開発した音声信号抽出法の推定精度を実験的に評価した。 具体的には、まず、提案した手法を騒音混入下での女声信号および男声信号に適用し推定誤差を計算し数値的に評価した。騒音としては、人工的騒音としてノイズジェネレータから発生した白色雑音およびピンク雑音を用いた。さらに、実際の騒音の1例として、事前にデータレコーダに録音した機械騒音を用いた。それぞれの騒音は、音のエネルギーにおいて、音声信号の1倍、2倍、3倍、5倍、10倍に人為的に設定し、音声信号とコンピュータにおいて合成した後、本手法を適用し音声信号に対する推定精度を数値的に詳細に計算・検討を行った。評価法としては、推定のRMS誤差および音質性能評価値の2種類において評価した。骨導音を活用しない、気導音のみを用いた従来法による結果と比較することにより、本研究で開発した手法の有効性について検討した結果、全ての場合において、本手法は従来法に比べ、音声信号に対し精度の良い推定結果が得られていることを確認した。 次に、騒音環境下での実測音声信号に本手法を適用した推定値に対し、音声認識ソフトを用い実際に音声認識を行うことにより、提案した手法の有効性を実験的に確認した。具体的には、女声信号および男声信号に対し、白色雑音・ピング雑音・機械騒音のそれぞれを、無響室において音声信号と同時に発生・計測することにより、騒音下での音声信号を作成した。その際、雑音の大きさは音声信号に対し、音のエネルギーにおいて約1倍、約2倍、約3倍になるように調整した。このような状況下で測定された音声に、本手法および従来法を適用し推定された音声に対し、音声認識を実施し両者を比較した。本手法を適用することによる認識結果は気導音のみを用いた従来法に比べ、良好な音声認識結果が得られていることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の目的である、騒音の混入した気導音の測定に加え騒音の影響を受けにくい体内伝導音を活用することにより、音声信号抽出のための信号処理法を理論的に導出した。さらに、研究開発した手法を実環境下で測定した音声データに適用することにより、実験的にもその有効性を確認した。研究成果はいくつかの学術論文および国際会議で公表した。
|
Strategy for Future Research Activity |
令和5年度に実施した実験結果を踏まえ、複数の音声信号が混在し、しかも騒音が存在する環境下で、対象とする音声信号のみを抽出する手法への拡張について検討・研究開発を実施する。 具体的には2種類の手法について検討する。まず手法1として、対象とする音声信号以外の全ての音声を雑音とみなし、周囲に存在する暗騒音と同時に除去する手法について検討する。令和5年度までに研究開発した手法を拡張することにより、対象とする音声信号に対する推定アルゴリズムを実現する。次に、手法2として、音圧の加法性を活用し、複数の音声および周囲騒音を気導音に対し加法性モデルで捉える。また、骨導音に対しては、個々の音声信号に対し、未知パラメータを持つ確率モデルで捉えることにより新たな手法を開発する。 新たな実験が必要な場合は追加実験を実施する。さらに、研究成果を国内外の学会で発表を行い、専門の学術誌に論文投稿を行う。
|
Report
(5 results)
Research Products
(28 results)