2023 Fiscal Year Annual Research Report
目的音と雑音の増減する環境下でのバリアフリー音声収録システムの開発
Project/Area Number |
20K12763
|
Research Institution | Ariake National College of Technology |
Principal Investigator |
石橋 孝昭 有明工業高等専門学校, 創造工学科, 准教授 (60455178)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 音声信号処理 / 雑音除去 / 目的音抽出 / 信号分離 |
Outline of Annual Research Achievements |
騒音のある環境においても、音声を聞き取りづらい障がい者や高齢者と一緒に会話できるために、他者の発話音声を含む複数の雑音が存在する環境での雑音除去機器の実用化を目指している。本研究で想定する雑音環境は、一般的な家庭やオフィスの室内であり、雑音の開始や終了、パワーの変化、音源位置の移動がある動的な音環境である。このような通常の環境であっても、会話相手以外の音が気になる者や、相手の声が聞こえづらい者がいることは周知の事実である。そのため、特定の音声だけを強調して、それ以外の音を抑制できる音声収録システムを実現を目指している。 本研究では、まず、音源の移動の無い環境での音源数を推定する方法や音源分離の方法を提案して、音環境の変動を検出することができた。また、発話の開始や終了のある音声データを用いて、目的話者音声が存在する期間だけを信号処理して、目的音声抽出法と雑音の抑制法を提案できた。その後、短時間フレーム処理を行うことで、移動音源にも対応できるシステムを提案した。さらに、複数話者が会話する状況を想定して実験を行った。このとき、一人の話者が発話しているときに、もう一人の話者が話しかけて二人同時に発話しているような、話者音声の数の増減を想定した。このような状況下でも、短時間フレーム処理を用いることで、目的の話者音声を抽出することができた。最後に、目的音よりも雑音のパワーが大きいときでも、雑音に埋もれた目的音声を抽出できる方法を提案した。
|