Research Abstract |
音声信号処理で広く利用されるているスペクトル表現パラメータであるメルケプストラムは,1次全域通過関数の縦続接続を基底関数として対数スペクトルを展開した係数として定義することができる.本研究では,基底関数を任意の関数系から選ぶことで,より自由度の高い効率的な音声スペクトル表現について検討を行った. まず,対数スペクトルを有限個の基底関数の線形結合によって表現したスペクトル推定法を定式化し,対数スペクトルの不偏推定におけるスペクトル評価関数の最小化問題と同様の問題に帰着されることを明らかにし,最適解を得るためのアルゴリズムを示した.そして,基底関数として離散ウェーブレット基底,特にハ-ル基底を用いることにより,ウェーブレットケプストラムが得られることを示した.さらに,通常のケプストラムやメルケプストラムは,複素指数関数や全域通過関数を基底関数とした特別な場合であり,本研究で示した手法はこれらを包含するような一般化とみることができる.また,ハ-ル基底関数を用いた場合について,各周波数帯域で使用する基底関数の数を適切に選ぶことにより,従来のメルケプストラムを用いたスペクトル表現に対してより効率的な表現が可能となることを,音声合成及び音素認識実験を通じて明らかにした.一方,スペクトルを表現する際により自由度の高い周波数分解能が可能となるよう,基底関数として2次全域通過関数を利用するスペクトル推定法についても定式化を行い,分析アルゴリズムを示すとともに,音声合成及び音素認識実験を通して有効性を示した.さらに,音声スペクトルの時間-周波数表現として,帯域通過フィルタと瞬時周波数に基づく新たなスペクトル表現法を示し,音声合成やピッチ抽出への応用の検討を行った.
|