研究概要 |
音声符号化方式は近年著しい進歩を遂げ,低ビットでの音声符号化技術は,移動体通信の普及に大きな貢献をもたらした.音声や画像の低ビット符号化の要素技術として欠かせないものに,ベクトル量子化が挙げられる.音声符号化の分野において1kbit/s程度での符号化方式が近年盛んに研究されているが,ソース・フィルタモデルを用いて音声の分析合成を行う場合,線形予測係数の時間変化までをも含めてベクトル量子化することが低ビット化の要請から必要となる.本研究では,線形予測係数ベクトルの時間変化パタンを,線形予測係数ベクトル系列自身が有する自己相似性を用いることにより効率的にセグメント量子化が可能な方法を提案した.すなわち研究代表者は,一般にLempel-Zivアルゴリズムとして知られている辞書ベースの圧縮符号化アルゴリズムを連続値系に適用することを考え,その結果,具体的なセグメント量子化方法を提案するに至った.音声信号の線形予測係数を対象として提案方式を評価した結果,MSVQやSplit-VQのようなフレーム単位でのベクトル量子化と比較して,歪みとレートの関係において高い性能を実現できることが確認された.また,時間的相関を利用する方式であるMA予測VQとの比較においては,DMOSによる主観評価とスペクトル歪による客観評価ではほぼ同等の性能が得られた. 本研究では,増分分解を単に連続データ系列に拡張したものを基本に用いたが,入力バッファの形式やコードブックの大きさの制限方法など,改良の余地が残されている.今後は,こうした観点から提案方式に改良を加えていく必要がある.
|