研究概要 |
本研究の目的は, ML-BEATS法を用いて音声信号中の類似区間を見つけ, それをひとつの符号として音声符号化を行うことで, 極低ビットレートで品質の高い音声符号化方法を確立することにある。そこで本年は, まずML-BEATS法を実装し, 小規模なデータを用いて基礎的な性能を評価する事を行った。 まず最初に, HMM学習のツールキットであるHTKをべースとして, ML-BEATS法の中で中心的な役割を持つSSS-freeアルゴリズムの実装を行った。HTKのコマンドやルーチンを効率的に活用し, 既存の音声認識システムとの整合性もとれる形式で, SSS-freeを実装することができた。 ここまでの実装についての性能を確認するため, 高頻度に出現する単語のみ単語モデルを構成する音響モデルの構築を行ったところ, 従来の音素モデルに比べてわずかながら性能の改善が得られ, 正しく実装されていることが確認された。 その後, HTKによるSSS-freeをべースとして, ML-BEATS法の実装を行い, 小規模な音声符号化実験を行った。特徴量には従来からの方法であるLSPを用いたところ, 従来法であるベクトル量子化法に比べ, 低ビットレートであるが, ケプストラム歪みも増加してしまう, という結果を得た。
|