研究課題/領域番号 |
25420423
|
研究種目 |
基盤研究(C)
|
研究機関 | 近畿大学 |
研究代表者 |
五反田 博 近畿大学, 工学部, 教授 (10153751)
|
研究分担者 |
白土 浩 近畿大学, 工学部, 准教授 (30315460)
石橋 孝昭 熊本高等専門学校, その他部局等, 准教授 (60455178)
松崎 隆哲 近畿大学, 工学部, 講師 (20363385)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | ブラインド信号分離 / スパース性 / リアルタイム雑音除去 / 捕捉距離制御 / 捕捉方位制御 / 低消費電力型雑音除去 |
研究概要 |
目的音と異なる方向からの雑音だけでなく、目的音の後方から到来する雑音も除去し、音圧比をもとに目的音のみを抽出する方法を確立し、それを具体化した即時稼働可能な低消費電力型リアルタイム雑音除去システムのプロトタイプを開発するため、音声のスパース性を利用した方法にベースに検討を進め、本年度は以下の結果を得た。 (1)タブレット端末(iPad 3rd)とデスクトップPC(iMac24 inch)を使って、12名の被験者を対象にFaceTimeによるビデオ通話時の距離・方向を調査した。その結果、タブレットを机に置いて通話した場合と手に持って通話した場合では、画面から話者の口元までの距離は平均約42cmと44cmとほぼ変わらないが、画面の傾きは58°と45°と開きがあることが分かった。また、デスクトップの場合、66cmと88°となってタブレットとは距離や傾きが大きく異なることが明らかになった。 (2)音圧比をもとに目的音のみを抽出する方法をコード化して、その捕捉距離や捕捉方向を具体的に検証するための統合的なプログラムを開発し、提案法の有効性をノイズレス環境下で検証した。 (3)また、位相差をもとに、1つの音源の到来方向をフレーム単位に推定する方法を提案した。すなわち,まず2つのマイクロホンで観測された混合信号を短時間離散フーリエ変換して得られる複素スペクトルの位相差をもとに、フレーム単位に時間周波数における局所DOAを求めて、その頻度分布をHoyer尺度で評価し、その値が0.5を越えるときを1音源フレームと判定する。次に,そのときの頻度分布のピークを探索し、ピークを採るときの方位を音源のDOA推定値とする方法を提案した。その結果、目的音源がブロードサイド方位から±30°の範囲にあるとき、残響時間が200msec以下でSN比が15dB以上あれば、目的音源のDOAを精度良く推定できることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究は、目的音と異なる方向からの雑音だけでなく、目的音の後方から到来する雑音も除去して、目的音のみを抽出する方法を確立し、それを具体化した即時稼働可能なリアルタイム雑音除去システムのプロトタイプを開発することを目的としている。そのため、初年度は計画通り、I.タブレット端末等で応用アプリ(ビデオ通話や音声認識)利用時の距離・方向に関する調査、II.捕捉距離制御に関する検討、III.捕捉方向制御(DOA推定値に基づくソフトマスク処理)に関する再検討について研究を進めた。その結果は、「9. 研究実績の概要」にそれぞれ(1)(2)(3)と記した通りで目標は概ね達成されたと考える。 なお、(2)で開発した統合プログラムについてFPGAへの実装を次年度以降に計画していたが、前倒しで実施した結果、実装予定のFPGAのオーデオコーディックに問題があることが判明し、採用機種を再選定する必要があることとの結論に達した。
|
今後の研究の推進方策 |
「9. 研究実績の概要」に記した初年度の成果(1)(2)(3)をもとに、次年度以降は、予定通り、IV.雑音除去に係る計算量と抽出音の品質に関する検討、V.即時稼働可能なリアルタイム雑音除去システムのプロトタイプ作成、について研究を進める計画である。まずIVでは、(2)で開発した統合プログラムをもとに、残響時間、暗騒音レベル、マイク間隔、目的音源や雑音源の位置等を変えて、抽出音の品質を総合的に評価・検討する。またVでは、上記の統合プログラムをC言語に移植し、浮動小数演算を整数演算、ソフトマスク関数をテーブル参照方式に直すなど最適化を行って、即時稼働可能なリアルタイム雑音除去システムのプロトタイプを試作する。 (3)の提案法は、標準的なMUSIC法より高精度にDOAを推定できることの他に、移動音源のDOA推定や発話区間検出に応用可能であることが分かった。そこで、上記計画に加えて、これらの可能性も併せて追求する予定である。
|