音声明瞭度向上を目的とした補聴器におけるノイズフロア決定手法
Project/Area Number |
19K12908
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 90150:Medical assistive technology-related
|
Research Institution | National Institute of Technology, Kumamoto College |
Principal Investigator |
中島 栄俊 熊本高等専門学校, 電子情報システム工学系CIグループ, 教授 (00353350)
|
Project Period (FY) |
2019-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
Fiscal Year 2021: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2020: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2019: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 雑音抑圧 / ノイズフロア / ラウドネス / SNR / 補聴器 / frequency warping filter / 音声明瞭度 |
Outline of Research at the Start |
ディジタル補聴器はフィルタを入力信号に施すことで雑音抑圧等が実現されるが,多くのアルゴリズムはフィルタにノイズフロアと呼ばれるフィルタゲイン最低値の設定が存在する。この値は音声明瞭度や雑音抑圧量,更には出力信号に発生するミュージカルノイズとも密接な関係があり極めて重要なパラメータであるが,その値は経験的に決定される。 本課題では,観測信号のラウドネスを用い音声明瞭度の観点からこの値の最適値を周波数ごとに求める。これまでの基礎検討でラウドネスを用いたノイズフロア決定方法の有効性を確認してきた。本課題においては音声信号の動的な変動にあわせたラウドネスを用いることでさらなる音声明瞭度の改善を目指す。
|
Outline of Annual Research Achievements |
補聴器に代表される人間が音を聞きやすくする上で使用される音響デバイスでは多くの場合,雑音抑圧機能が搭載されている。ディジタル信号処理で求められたディジタルフィルタを入力信号に施すことでこの機能は実現されるが,アルゴリズムの多くははフィルタの演算にノイズフロアと呼ばれる,フィルタゲイン最低値の設定が存在する。このノイズフロアは音声明瞭度や雑音・残響抑圧量,さらには出力信号に発生するミュージカルノイズとも密接な関係があり,極めて重要なパラメータであるが,その決定方法に画一的なものがなく経験的に決められる。またその値は本来,音声信号の時間‐周波数特性に応じて変動させるべき値であるが,これについても経験的に求められた固定値が使用されており,十分な音声明瞭度改善がなされていない。 本研究課題ではこのノイズフロアレベルを観測信号のラウドネスと観測信号のSNR推定値から音声信号のラウドネスを推定し、その値に応じてノイズを付加する手法を検討してきた。これにより,観測信号のSNRが低い状況下においても音声信号のラウドネスの推定が精度よく行うことが期待できる。 これまでの研究の結果から、同手法において得られる出力信号が客観的評価値であるSTOI、eSTOIにおいて従来法より高い数値を出すことを明らかにしてきた。一方で補聴器に搭載することを考慮した場合、ラウドネスの演算量は無視できないほど大きい。また、ラウドネス算出にあたっては帯域ごとのエネルギーを随時求めらければならず、低遅延の周波数解析手法が望まれている。これらのことからFrequency Warping Filterを用いた低遅延なラウドネス算出方式について検討を行う。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
これまでの研究で観測信号ラウドネスと推定したSNRから音声信号ラウドネスを近似的に求める手法を構築してきた。これは既知の観測信号、音声信号、SNRからそれぞれのラウドネスを求め、観測信号ラウドネス、音声信号ラウドネス、SNRを軸とする対応表を作成し、それを帯域ごとに曲面近似したものである。 一方で現在行っている手法においては低遅延での観測信号のラウドネス算出が不可欠である。本研究においては低遅延の周波数解析として知られるfrequency warping filter(FWF)を用いる。ラウドネス算出においては、1/3オクターブバンドごとのエネルギー算出が必要であり、FWFの出力から1/3オクターブバンドごとのエネルギーを算出する必要があるが、1/3オクターブバンドとFWFの帯域幅が一致しないため難しい。 この問題に対し、一般的なラウドネス計算を行うことなく、観測信号のFWF出力からニューラルネットワークを用いて直接ラウドネスを求める手法について検討してきた。この結果、信号レベルによっては、観測信号のFWF出力からラウドネスを一定誤差範囲で推定することを確認した。しかし、ラウドネスが音圧レベルに対して非線形な関数であるため、観測信号のレベルが大きく変動した場合、ラウドネス推定誤差が大きくなってしまう問題が生じている。この問題に対してはより多くの学習を行うことで解決を試みているが現在まで期待する結果が得られていない。
|
Strategy for Future Research Activity |
音声信号のラウドネス推定においては、観測信号ラウドネス、音声信号ラウドネス、SNRを軸とする対応表を作成し、それを帯域ごとに曲面近似したものを用いることで、帯域ごとの音声信号ラウドネスを近似的に算出することができている。一方で、演算量が非常に多く、補聴器レベルのプロセッサでは演算が間に合わないことから、演算手法についてはFWFの出力とニューラルネットワークを用いた音声信号ラウドネス推定についての研究を行う必要がある。 これまでの研究で、信号のレベルが大きく変動しない場合はラウドネス推定が一定誤差範囲で行えることがわかっている。ただし、音声信号はダイナミックに変動し、また環境雑音を含めて考慮すると様々なレベル、スペクトルパターンにおけるラウドネスを教師信号として学習させる必要がある。 更に提案手法は雑音に対し、ラウドネス上で何soneレベルを減衰させるか決定しており、その値をFWFのフィルタゲインに変換する必要がある。この演算も非線形であり、かつ帯域によって値が異なることからニューラルネットワークを利用することを検討する。
|
Report
(4 results)
Research Products
(2 results)