研究概要 |
本研究は従来, 線形領域で求められていた分析合成系のパラメータを非線形領域において求めることにより, 中帯域伝送路における, 音声の品質向上を目的とするものである. 一般的に音声の情報圧縮によく用いられる分析合成系は, その伝送パラメータを線形な周波数領域において求めているが, 人間の聴覚特性は周波数に於て非線形である. 本研究はこの事に着目し, 人間の聴覚特性に基づくメル目盛り上での分析合成系を構築することにより音声の品質向上を目指した. 62年度科学研究費の補助により, まずLSPを用いた分析合成系をメル目盛り上で実現する方法を提案した. これにより線形時間軸上の音声信号から直接メルLSP分析合成を行なうことを可能にした. 次に, 低周波数域はメルLSPで非線形に表現し高周波数域は従来のLSPで線形に表現するようなLSP分析合成システムをパーソナルコンピュータPC-9801上で構築した. これにより音声を非線形領域に変換して分析を行う際に従来から問題となっていた音質向上効果の低減を防ぐことが可能となった. またこのシステムを用いてメルLSPとLSPの分析次数の割当の最適化を行い, 分析次数の和が10のときは, メルLSPの分析次数を8, 従来のLSPの分析次数を2とした場合に合成音声の音質が最も良いことを確認した. さらに本システムと従来のLSP分析合成系との合成音声の音質の比較を行なった結果, 本システムによる合成音声は従来法の12次の合成音と同等あるいはそれ以上の音質であることを確認した. これにより従来の分析合成系より高音質な合成音声を得ることが可能となった.
|