体内伝導音と音声信号の高次相関情報活用による騒音下でのベイズ推定に基づく信号抽出
Project/Area Number |
19K04428
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 21030:Measurement engineering-related
|
Research Institution | Prefectural University of Hiroshima |
Principal Investigator |
生田 顯 県立広島大学, 経営情報学部, 名誉教授 (30145164)
|
Co-Investigator(Kenkyū-buntansha) |
折本 寿子 (益池寿子) 県立広島大学, 地域創生学部, 教授 (80533207)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2021: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2020: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2019: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | 音声信号検出 / ベイズ推定 / 気導音 / 周囲環境騒音 / 体内伝導音 / 周囲環境 / 周囲騒音 / 音声信号 / 高次相関情報 / 騒音環境 |
Outline of Research at the Start |
ディジタル情報技術の進展に伴い、音声認識システムが開発され様々な分野で応用されているが、音の存在する実環境下においては認識が困難な場合が多い。本研究では、騒音の混入した気導音の測定に加えて、騒音の影響を受けにくい体内伝導音を活用することにより、音声信号抽出のための手法を提案する。具体的には、音声信号の時系列と体内伝導音との各種相関情報を反映した結合確率分布を用い、非線形の音声時系列モデルを用いることにより、実環境下での音声認識が可能な手法を見出す。本研究は確率論(ベイズ推定)に基づくところに特徴があり、計算の負荷が確定論に比べ大幅に減少することから、音声認識の分野での実用化が期待される。
|
Outline of Annual Research Achievements |
令和3年度までに研究開発した音声信号抽出法の有効性を評価するために、2つの状況下での実験を実施した。 まず、騒音が存在しない状況下での音声信号を別途に測定し、騒音と無響室で合成することにより騒音が混入した状況での音声信号を作成した。その後、研究開発した音声信号抽出法を適用し推定誤差を計算することによりその推定精度を数値的に評価した。具体的な音声信号としては女声信号および男声信号をそれぞれ1サンプルづつ採用し、騒音としては白色雑音、有色雑音、機械騒音の3種類を用い、それぞれの組み合わせに対し5通りのSN比において音声信号の推定を行った。また、比較のため、気導音のみを用いて推定した結果、および既発表の音声信号抽出法を適用した結果と比較検討を行った。その結果、ほとんどの場合において、本研究において開発したアルゴリズムは他の2種のアルゴリズムより優れていることが数値的に確認された。 次に、騒音が存在する実環境下で音声を収録し、研究開発したアルゴリズムに適用することにより音声信号抽出を行った。これまでの実験と同様に、女声信号および男声信号を採用し、白色雑音および有色雑音をノイズジェネレータで発生させ、それぞれの雑音下での音声信号を無響室で収録し、研究開発したアルゴリズムを適用した。また、機械騒音を事前にデータレコーダに録音しておき、無響室で再生することにより騒音環境を実現し、この状況下での音声信号を計測した。いずれの場合も雑音の大きさを調整し、3通りの異なるSN比の状況を作り出した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
これまでに研究開発した音声信号抽出法の推定精度を数値的に評価するために、令和4年度は無響室での大規模な実験を実施した。具体的には、新型コロナ感染予防の観点から実施できなかった実験について、研究実績の概要に記載した2つの状況での実験を実施した。しかし、実験計画やデータ処理に時間を費やし、研究成果をまとめ公表する時間的余裕が不足していたため、これらは未発表となっている。 次年度は、研究成果を論文としてまとめ、国際会議での発表や学術誌に投稿を行う。また、実験の不足を補う追加実験を必要に応じて実施する。
|
Strategy for Future Research Activity |
令和4年度は、これまでに研究開発した音声信号抽出法の推定精度を数値的に評価するため、新たに大規模な実験を実施した。 次年度は研究開発した音声信号抽出法の推定精度をより詳細に評価する。具体的には、提案した手法を適用し推定された音声信号に対し性能評価値を計算する。さらに、従来法による結果と比較することによりその有効性について評価する。また、騒音環境下での実測音声信号に本手法を適用した推定値に対し、音声認識ソフトを用い実際に音声認識を行うことにより、提案した手法の有効性を実験的に確認する。 以上の実験結果を踏まえ、複数の音声信号が混在し、しかも騒音が存在する環境下で、対象とする音声信号のみを抽出する手法への拡張について検討・研究開発を実施する。新たな実験が必要な場合は追加実験を実施する。 さらに、研究成果を国内外の学会で発表を行い、専門の学術誌に論文投稿を行う。
|
Report
(4 results)
Research Products
(21 results)