• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

振幅スペクトログラム量子化と位相復元復号化に基づく音響信号符号化の研究

Research Project

Project/Area Number 23650083
Research InstitutionNational Institute of Informatics

Principal Investigator

小野 順貴  国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)

Co-Investigator(Kenkyū-buntansha) 嵯峨山 茂樹  東京大学, 情報理工学(系)研究科, 教授 (00303321)
鎌本 優  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 守谷特別研究室, 研究員 (00418550)
Project Period (FY) 2011-04-28 – 2013-03-31
Keywords符号化 / スペクトログラム / 位相復元 / 音楽構造解析
Research Abstract

本研究の目的は、振幅スペクトログラムの量子化・符号化と、位相スペクトログラムの復元に基づく波形復号化を原理とする新しい音響信号符号化技術を構築することである。本研究の核となる、1)量子化された振幅・位相スペクトログラムから高品質の時間波形を復元する手法と、2)振幅スペクトログラムの効率的な圧縮方法、に基づき、新しい音響符号化方式を開拓することを目指している。平成23年度は、大きく2つの課題について取り組んだ。1つ目は量子化範囲を考慮した位相復元法の改良である。従来の位相復元法は、適切な初期位相の付与の下で、 A) 逆短時間Fourier変換による波形合成、B) 短時間Fourier変換による複素スペクトログラムの計算、C) 得られた位相スペクトログラムへの置き換え、の3工程の反復演算からなる。本研究ではB)で得られた位相スペクトログラムが量子化範囲を超えてしまったら量子化範囲内に引き戻す、範囲制限位相復元という新しい手法を考案し、従来の位相復元をそのまま適用するよりも音質が改善されることを確認した。2つ目は音楽構造を利用した音響信号の符号化である。多くの音楽楽曲は繰り返し構造を持ち、その繰り返し構造は振幅スペクトログラムによく現れることに着目し、音楽進行の確率モデルに基づき、与えられた楽曲の構造を自動的に推定する手法を考案し、また、繰り返し箇所は初出部分との差分を符号化する方式について予備実験を行い、全体の情報量が圧縮できる実験結果を得た。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の計画である、1)量子化された振幅・位相スペクトログラムから高品質の時間波形を復元する手法と、2)振幅スペクトログラムの効率的な圧縮方法、の両方について、成果が得られているため。2)については、音楽構造の利用と平行して、非負値行列分解を利用する手法についても検討を進めている。

Strategy for Future Research Activity

今年度は主に、1)振幅・位相スペクトログラムの効率的な量子化方法と、2)その効率的な圧縮方法について検討を進める。1)については、特に振幅スペクトログラムの量子化に焦点をあてる。現在は対数振幅への等間隔量子化を適用しているが、対数振幅を適用すると、エネルギーの小さな成分に対して過大な情報量を割り振ってしまう可能性があるため、振幅のx乗(xは0と1の間の実数)などの量子化についても検討する。また、聴覚モデルの導入についても検討する。位相の量子化方法については、振幅に依存して符号長を可変にする適応量子化などについて検討する。2)については、前年度の成果である音楽構造の利用した符号化を発展させる。具体的には、前年度は音楽進行の確率モデルを前提として最尤経路を求めることにより構造を解析したが、これをより直接的に、符号長を目的関数とし、符号長が最小となる構造を自動的に求める手法へ発展させる。また、非負値行列分解など、ほかの手法の検討も並行して行う。

Expenditure Plans for the Next FY Research Funding

研究を効率よく進めるための音響信号処理ソフトウェア、計算機関連消耗品(音響データの保存用HDD等)、関連学会への参加旅費、音質評価実験の被験者への謝金等、計画通りの執行を予定している。

  • Research Products

    (3 results)

All 2012 2011

All Journal Article (2 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] 動的計画法に基づく音楽構造解析とその音楽 信号符号化への応用2012

    • Author(s)
      藏悠子,鎌本優,小野順貴,嵯峨山茂樹
    • Journal Title

      日本音響学会2012年春季研究発表会講演集

      Volume: - Pages: 1049-1050

  • [Journal Article] スペクトログラムの振幅・位相量子化と範囲制限 位相復元に基づく音響信号符号化の検討2011

    • Author(s)
      佐藤匠, 小野順貴, 鎌本優, 嵯峨山茂樹
    • Journal Title

      日本音響学会2011年秋季研究発表会講演集

      Volume: - Pages: 229-230

  • [Patent(Industrial Property Rights)] 音声再生装置、音声再生方法及びコンピュータプログラム2011

    • Inventor(s)
      小野順貴、嵯峨山茂樹、佐藤匠
    • Industrial Property Rights Holder
      情報・システム研究機構種類
    • Industrial Property Number
      特願2011-197404
    • Filing Date
      2011-09-09

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi