ディジタル補聴器における雑音除去を目的とし、砂時計ニューラルネットワークを多段に接続した構造を持つ多段接続SNN雑音除去フィルタ(Cascade SNN Noise Reduction Filter : CSNNRF)を提案した。ここで、SNNは、入力層と出力層のユニット数を同数とし、中間層のユニット数を入・出力層のユニット数よりも少なくした構造を持つ階層型ニューラルネットワークである。SNNの学習は、入力と同じ信号を教師信号として与えて行う。SNNを構成するユニットの応答関数を線形関数にすれば、学習が収束したSNNはKarhunen-Love(KL)変換および逆変換と等価な変換、すなわち主成分分析と等価な処理を行うことが知られている。中間層のユニット数をM個にしたSNNでは、入力信号のKL変換成分を寄与率の高い順にM個目まで含む信号が出力として得られる。 本研究では、入出力層ユニット数を20個、中間層ユニット数を1個の3層SNN(以降、単位SNNと呼ぶ)を20段接続することで、CSNNRFを構成した。CSNNRFの初段単位SNNに白色雑音を含む音声信号を入力し、2段目以降の単位SNNには前段の誤差信号(入力信号と出力信号の差)を入力する。すると、第N段SNNの出力層で第N主成分の時系列信号が出力され、入力信号の主成分を寄与率の高い順に分離することが出来る。さて、音声信号では母音等の有声音が占める時間的割合が大きい。 有声音では各主成分のパワーの比(寄与率)に大きな差が見られる一方、白色雑音では各主成分の寄与率の期待値はすべて等しい。この性質を利用し、入力信号の主成分を母音の標準モデル群(代表的な主成分の寄与率分布のモデル)に回帰させることによって、入力信号の各主成分に含まれる音声成分と雑音成分のパワーを各々推定する。両成分の推定パワーに応じて各主成分に乗じる荷重と加算する主成分の数を変化させ、重み付き総和を求めてCSNNRFの出力とする。これによって、音声成分の大幅な歪を抑えつつ、雑音成分を効果的にかつ適応的に低減することができる。なお、学習則に逐次最小二乗法を応用した高速アルゴリズムを適用することにより、信号の入力区間毎に実時間で逐次学習を実行することを可能にした。
|