研究課題/領域番号 |
23650083
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小野 順貴 国立情報学研究所, 情報学プリンシプル研究系, 准教授 (80334259)
|
研究分担者 |
嵯峨山 茂樹 東京大学, 情報理工学(系)研究科, 教授 (00303321)
鎌本 優 日本電信電話株式会社NTTコミュニケーション科学基礎研究所, 守谷特別研究室, 研究員 (00418550)
|
キーワード | 符号化 / スペクトログラム / 振幅 / 位相 / 位相復元 |
研究概要 |
本研究の目的は、振幅スペクトログラムの量子化・符号化と、位相スペクトログラムの復元に基づく波形復号化を原理とする新しい音響信号符号化技術を構築することである。今年度は特に、1)量子化された振幅/位相スペクトログラムからの高音質波形合成法と、2)振幅スペクトログラムの効率的な圧縮法に取り組んだ。1)に関しては、従来、振幅スペクトログラムのみから位相スペクトログラムを推定するために用いられてきた位相復元手法を、量子化された振幅・位相スペクトログラムからの波形合成部分に応用し、範囲制限つき位相復元という手法を考案した。この提案法では、量子化された値は量子化前にはある量子化範囲に含まれなければならないことを制約条件として用いて、位相復元のための反復時にこの範囲の外に出てしまった場合には、値を範囲内に引き戻す操作を行う。これにより、単なる逆量子化を適用するよりも音質が改善されることを示した。本成果は、国際会議DAFxで報告した。また、2)に関しては、音楽信号の振幅スペクログラムには、楽曲構造に由来した繰り返し構造が頻繁に現れる点に着目し、2回目以降の繰り返し部分は、最初に現れた部分との差分のみを符号化することで、全体の情報量を削減する手法に取り組んだ。これを行うためには、与えられた振幅スペクトログラムの類似箇所を自動的に推定する手法が必要になるが、我々は、符号長最小化の規準で、最適な繰り返し構造を動的計画法を用いて検出するアルゴリズムを考案した。また、これに基づき音楽構造推定の新しいアルゴリズムを考案し、音楽情報検索の世界的コンテストMIREXに投稿を行った。
|