研究課題/領域番号 |
25420423
|
研究機関 | 近畿大学 |
研究代表者 |
五反田 博 近畿大学, 工学部, 教授 (10153751)
|
研究分担者 |
白土 浩 近畿大学, 工学部, 准教授 (30315460)
石橋 孝昭 熊本高等専門学校, その他部局等, 准教授 (60455178)
松崎 隆哲 近畿大学, 工学部, 講師 (20363385)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | ブラインド信号処理 / スパース性 / リアルタイムDOA推定 / 音源フレーム検出 / リアルタイム音源分離 / 低消費電力型雑音除去 |
研究実績の概要 |
即時稼働可能な低消費電力型リアルタイム雑音除去システムのプロトタイプを開発するため、初年度実施して得られた研究成果をもとに検討を進め、本年度は以下の結果を得た。 (1)初年度提案したフレーム単位のDOA(Direction of Arrival:到来方向)推定法の有効性や発展性を調べるため、既存の代表的なDOA推定法MUSICと比較実験を行った。提案法とMUSICは、前者が断続的な広帯域信号/後者が連続的な狭帯域信号を対象にしている点、前者が単一フレーム/後者が複数フレームを利用する点が異なる。比較実験の結果、MUSICは提案法に比べて、より広角な範囲のDOA推定が可能であるが、音声のように断続的な広帯域信号のDOAを推定した場合、推定値のバラツキが大きくリアルタイム性に欠けることが明らかになった。また、推定値のバラツキの原因をCramer-Rao Boundの観点から明確にした。 (2)初年度提案したフレーム単位のDOA推定法を3音源が活性する環境下に適用し、得られたDOA推定値をもとに、マイクロホンで観測された混合信号をマスク処理して、目的音のみを分離する実験を行って、分離音の品質を評価した。3つの音質評価指数 ISR (Source Image to Spatial distortion Ratio), SAR (Signal to Artifacts Ratio), SDR (Signal to Distortion Ratio) で評価した結果、残響時間が200msで目的音源と暗騒音とのSN比が20dBの場合、ハードマスク処理でSDR=2.20dB, ISR=3.78dB, SAR=0.36dB、ソフトマスク処理でSDR=3.06dB, ISR=4.70dB, SAR=1.98dBとなって、ソフトマスク処理の方が分離能力は高いことを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究は、目的音と異なる方向からの雑音だけでなく、目的音の後方から到来する雑音も除去して、目的音のみを抽出する方法を確立し、それを具体化した即時稼働可能なリアルタイム雑音除去システムのプロトタイプを開発することを目的としている。そのため、本年度は計画通り、(i)提案法(フレーム単位のDOA推定法)の有効性と発展性について研究を進めた。その結果は、「9. 研究実績の概要」(1)に記した通りで目標は概ね達成されたと考える。 また、(ⅱ)提案法によるDOA推定値をもとにマスク処理してマイクロホンの指向性を目的音方向に向けて目的音を抽出する検討を行った。その結果は、「9. 研究実績の概要」(2)に記した通りで目標は概ね達成されたと考える。 なお、上記(i) (ⅱ)について、FPGAによるハードウェア化を進めているが、オーディオコーデックのA/D・D/A変換部で音声信号の遅延と歪みが起きており、現在その原因を調査中である。
|
今後の研究の推進方策 |
1.提案法によるリアルタイム音源分離について、残響時間、暗騒音レベル、マイク間隔、目的音源や雑音源の位置等を変えて、分離音の品質を総合的に評価して、分離音の品質向上策を検討する。 2.提案法(フレーム単位のDOA推定法)は固定音源のDOA推定を目的とした手法であるが、移動音源のDOA推定や発話区間検出にも応用できる。この観点から、提案法の拡張・発展を追求する予定である。 3.上述の成果に基づいて移動音源の音源分離を試み、分離音を評価する。 4.前述 A/D・D/A変換部での音声信号の遅延と歪みの原因を引き続き調査して解決を図る。
|