• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

ML-BEATS法を用いた高効率音声符号化法の開発

研究課題

研究課題/領域番号 20760229
研究機関徳島大学

研究代表者

鈴木 基之  徳島大学, 大学院・ソシオテクノサイエンス研究部, 准教授 (30282015)

キーワードML-BEATS法 / 音声符号化 / セグメント量子化 / HMM
研究概要

本研究の目的は, ML-BEATS法を用いて音声信号中の類似区間を見つけ, それをひとつの符号として音声符号化を行うことで, 極低ビットレートで品質の高い音声符号化方法を確立することにある。そこで本年は, まずML-BEATS法を実装し, 小規模なデータを用いて基礎的な性能を評価する事を行った。
まず最初に, HMM学習のツールキットであるHTKをべースとして, ML-BEATS法の中で中心的な役割を持つSSS-freeアルゴリズムの実装を行った。HTKのコマンドやルーチンを効率的に活用し, 既存の音声認識システムとの整合性もとれる形式で, SSS-freeを実装することができた。
ここまでの実装についての性能を確認するため, 高頻度に出現する単語のみ単語モデルを構成する音響モデルの構築を行ったところ, 従来の音素モデルに比べてわずかながら性能の改善が得られ, 正しく実装されていることが確認された。
その後, HTKによるSSS-freeをべースとして, ML-BEATS法の実装を行い, 小規模な音声符号化実験を行った。特徴量には従来からの方法であるLSPを用いたところ, 従来法であるベクトル量子化法に比べ, 低ビットレートであるが, ケプストラム歪みも増加してしまう, という結果を得た。

  • 研究成果

    (1件)

すべて 2009

すべて 学会発表 (1件)

  • [学会発表] 混合重み再学習を用いた単語モデルによる連続音声認識2009

    • 著者名/発表者名
      大越真祐美
    • 学会等名
      日本音響学会2009年春季研究発表会
    • 発表場所
      東京
    • 年月日
      2009-03-17

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi