研究課題/領域番号 |
23650083
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小野 順貴 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)
|
研究分担者 |
嵯峨山 茂樹 東京大学, 情報理工学(系)研究科, 教授 (00303321)
鎌本 優 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 守谷特別研究室, 研究員 (00418550)
|
研究期間 (年度) |
2011-04-28 – 2013-03-31
|
キーワード | 符号化 / スペクトログラム / 位相復元 / 音楽構造解析 |
研究概要 |
本研究の目的は、振幅スペクトログラムの量子化・符号化と、位相スペクトログラムの復元に基づく波形復号化を原理とする新しい音響信号符号化技術を構築することである。本研究の核となる、1)量子化された振幅・位相スペクトログラムから高品質の時間波形を復元する手法と、2)振幅スペクトログラムの効率的な圧縮方法、に基づき、新しい音響符号化方式を開拓することを目指している。平成23年度は、大きく2つの課題について取り組んだ。1つ目は量子化範囲を考慮した位相復元法の改良である。従来の位相復元法は、適切な初期位相の付与の下で、 A) 逆短時間Fourier変換による波形合成、B) 短時間Fourier変換による複素スペクトログラムの計算、C) 得られた位相スペクトログラムへの置き換え、の3工程の反復演算からなる。本研究ではB)で得られた位相スペクトログラムが量子化範囲を超えてしまったら量子化範囲内に引き戻す、範囲制限位相復元という新しい手法を考案し、従来の位相復元をそのまま適用するよりも音質が改善されることを確認した。2つ目は音楽構造を利用した音響信号の符号化である。多くの音楽楽曲は繰り返し構造を持ち、その繰り返し構造は振幅スペクトログラムによく現れることに着目し、音楽進行の確率モデルに基づき、与えられた楽曲の構造を自動的に推定する手法を考案し、また、繰り返し箇所は初出部分との差分を符号化する方式について予備実験を行い、全体の情報量が圧縮できる実験結果を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の計画である、1)量子化された振幅・位相スペクトログラムから高品質の時間波形を復元する手法と、2)振幅スペクトログラムの効率的な圧縮方法、の両方について、成果が得られているため。2)については、音楽構造の利用と平行して、非負値行列分解を利用する手法についても検討を進めている。
|
今後の研究の推進方策 |
今年度は主に、1)振幅・位相スペクトログラムの効率的な量子化方法と、2)その効率的な圧縮方法について検討を進める。1)については、特に振幅スペクトログラムの量子化に焦点をあてる。現在は対数振幅への等間隔量子化を適用しているが、対数振幅を適用すると、エネルギーの小さな成分に対して過大な情報量を割り振ってしまう可能性があるため、振幅のx乗(xは0と1の間の実数)などの量子化についても検討する。また、聴覚モデルの導入についても検討する。位相の量子化方法については、振幅に依存して符号長を可変にする適応量子化などについて検討する。2)については、前年度の成果である音楽構造の利用した符号化を発展させる。具体的には、前年度は音楽進行の確率モデルを前提として最尤経路を求めることにより構造を解析したが、これをより直接的に、符号長を目的関数とし、符号長が最小となる構造を自動的に求める手法へ発展させる。また、非負値行列分解など、ほかの手法の検討も並行して行う。
|
次年度の研究費の使用計画 |
研究を効率よく進めるための音響信号処理ソフトウェア、計算機関連消耗品(音響データの保存用HDD等)、関連学会への参加旅費、音質評価実験の被験者への謝金等、計画通りの執行を予定している。
|