研究課題
本年度、畳み込み混合となる混合音のブラインド音源分離処理に関して2つの研究を行った。(1)Sparse Representationに基づいて畳み込み混合となる混合音のブラインド信号分離処理音声源信号について、ほとんどのサンプルが零、または零に近い値となる、いわゆる、Sparsityと言う特性を持つ。周波数領域においてはこの特性が特に顕著である。周波数領域でのもう1つの特徴として、時間領域での畳み込み混合が周波数領域での瞬時性混合となるため、Sparse Component Analysisと言う手段で源信号を分離することができる。本研究ではSparsity Representationを用いて畳み込み混合となる混合音のブラインド信号分離処理の方法を提案し、そのアルゴリズムの有効性を確認した。周波数領域では、音声信号が複素数となるため、確立分布が複素数なラプラス分布で表れる。この確率分布が最大となるように、いわゆる、Maximum Likelihood基準で混合行列と源信号を推定することでブランド信号分離処理を定式化する。ただし、推定された混合行列と源信号との乗算結果が観測信号と同じになるという拘束条件を満たすことが必要である。(2)非線形共分散行列対角化原理に基づく直交変換による独立成分分析時間領域での畳み込み混合が周波数領域では瞬時性混合となるため、ブラインド信号分離問題を独立成分分析問題と変更することができる。本研究では、有力な独立成分分析について新しい手段を研究した。従来の独立成分分析方法では、コスト関数の勾配を用いて最速降下法で最適化を図った。このような方法には、収束が遅いということ、事前に決めることが必要である学習ステップというパラメータが存在するということの2つの欠点が挙げられる。本研究で、我々は独立成分分析問題を非線形共分散行列の対角問題に転換し、直交変換を用いて対角を行うことを提案し、有効性を確認した。
すべて 2007 2006
すべて 雑誌論文 (4件)
International Journal of Innovative Computing, Information and Control, has been. 「発表予定」(accepted for a publication)
IEEE Transactions on Audio, Speech and Language Processing, has been. 「発表予定」(accepted for a publication)
Proc. ICICIC-06 (International Conference on Innovative Computing, Information and Control 2006) ICICIC-06
ページ: 730-733
Proc. CIT 2006 (2006 IEEE International Conference on Computer and Information Technology) CIT 2006
ページ: 135-139