• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

聴覚フィルタを用いた音声信号の高能率符号化方式に関する研究

研究課題

研究課題/領域番号 11650392
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 情報通信工学
研究機関千葉工業大学

研究代表者

木幡 稔 (小幡 稔)  千葉工業大学, 工学部, 教授 (30186720)

研究期間 (年度) 1999 – 2000
研究課題ステータス 完了 (2000年度)
配分額 *注記
1,700千円 (直接経費: 1,700千円)
2000年度: 500千円 (直接経費: 500千円)
1999年度: 1,200千円 (直接経費: 1,200千円)
キーワード音声符号化 / 聴覚フィルタ / ボコーダ / ハーモニック・コーディング / 主観的音質 / 情報圧縮 / ハーモニック コーディング
研究概要

本研究では,音声符号化においてこれまで用いられてきたAbS型の符号化が,音質を維持しつつビットレートを削減するには限界に達している問題を解決するために,聴覚特性を利用したボコーダ型の1.2kbps極低ビット音声符号化方式を新たに提案した.提案方式はLPCボコーダと同程度の情報を用いながら,その音質を良好なものとするために,いわゆるHarmonic codingの手法を採用し,その振幅成分を聴覚フィルタを用いて適応的に変調するものである.本研究では,聴覚フィルタの1つであるGammatoneフィルタを用いてharmonicsを変調する方法を提案し極低ビット化と音質維持を両立させることに成功した.また,音源信号の位相に関しても聴感特性を考慮した変調方法を提案し,主観的音質を向上させることができた.符号化音声の音質評価のために主観評価実験を行った結果,提案方法による合成音声の音質は,1.2kbpsのLPCボコーダのそれと比較してプリファレンススコアで37.5%,MOS値で0.45改善され,また2.4kbpsのMELP方式と比較して同程度の主観的音質が得られることが確認された.以上の成果により,1.2kbit/sにおいて音声符号化を行うことが可能となったが,さらに音質を改善するために精度の高いピッチ抽出方法を実装した.また,Gammatoneフィルタと同様の処理が可能でありながら,構成がより単純で,スペクトル整形を行うためのパラメータ調整を試行錯誤的に行うことができるフィルタとして聴感重みづけフィルタを南い,Gammatoneフィルタの替わりにスペクトルの整形処理を行った結果,この2つの改善前の音声と比較してMOS値で0.87改善することができた.

報告書

(3件)
  • 2000 実績報告書   研究成果報告書概要
  • 1999 実績報告書
  • 研究成果

    (4件)

すべて その他

すべて 文献書誌 (4件)

  • [文献書誌] M.Kohata,I,Mitsuya,M.Suzuki, S.Makino: "Efficient segment quantization of LSP coefficients for very low bit speech coding"Proc.Int.Conf.on Spoken Language Processing. 2000.3. 826-829 (2000)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] M.Kohata, I.Mitsuya, M.Suzuki, S.Mokino: "Efficient segment quantization of LSP coefficients for very low bit speech coding"Proc.Int.Conf.on Spoken Language Processing. vol.2000.3. 826-829 (2000)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] M.Kohata,I.Mitsuya,M.Suzuki,S.Makino: "Efficient segment quantization of LSP Coefficients for very low bit speech coding"Proc.Int.Conf.on Spoken Language Processing. 2000・3. 826-829 (2000)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] 木幡 稔: "正弦波重畳型ボコーダによる1.2kbit/s音声符号化方式"電子情報通信学会論文誌. J82-D-II 3__-. 340-349 (1999)

    • 関連する報告書
      1999 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi