• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

ML-BEATS法を用いた高効率音声符号化法の開発

Research Project

Project/Area Number 20760229
Research InstitutionThe University of Tokushima

Principal Investigator

鈴木 基之  The University of Tokushima, 大学院・ソシオテクノサイエンス研究部, 准教授 (30282015)

KeywordsML-BEATS法 / 音声符号化 / セグメント量子化 / HMM
Research Abstract

本研究の目的は, ML-BEATS法を用いて音声信号中の類似区間を見つけ, それをひとつの符号として音声符号化を行うことで, 極低ビットレートで品質の高い音声符号化方法を確立することにある。そこで本年は, まずML-BEATS法を実装し, 小規模なデータを用いて基礎的な性能を評価する事を行った。
まず最初に, HMM学習のツールキットであるHTKをべースとして, ML-BEATS法の中で中心的な役割を持つSSS-freeアルゴリズムの実装を行った。HTKのコマンドやルーチンを効率的に活用し, 既存の音声認識システムとの整合性もとれる形式で, SSS-freeを実装することができた。
ここまでの実装についての性能を確認するため, 高頻度に出現する単語のみ単語モデルを構成する音響モデルの構築を行ったところ, 従来の音素モデルに比べてわずかながら性能の改善が得られ, 正しく実装されていることが確認された。
その後, HTKによるSSS-freeをべースとして, ML-BEATS法の実装を行い, 小規模な音声符号化実験を行った。特徴量には従来からの方法であるLSPを用いたところ, 従来法であるベクトル量子化法に比べ, 低ビットレートであるが, ケプストラム歪みも増加してしまう, という結果を得た。

  • Research Products

    (1 results)

All 2009

All Presentation (1 results)

  • [Presentation] 混合重み再学習を用いた単語モデルによる連続音声認識2009

    • Author(s)
      大越真祐美
    • Organizer
      日本音響学会2009年春季研究発表会
    • Place of Presentation
      東京
    • Year and Date
      2009-03-17

URL: 

Published: 2010-06-11   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi