2006 Fiscal Year Annual Research Report
音楽解析・認識・生成のための多重音の信号処理と情報処理の研究
Project/Area Number |
17300054
|
Research Institution | The University of Tokyo |
Principal Investigator |
嵯峨山 茂樹 東京大学, 大学院情報理工学系研究科, 教授 (00303321)
|
Co-Investigator(Kenkyū-buntansha) |
小野 順貴 東京大学, 大学院情報理工学系研究科, 講師 (80334259)
西本 卓也 東京大学, 大学院情報理工学系研究科, 助手 (80283696)
金子 仁美 桐朋学園大学, 音楽学部, 講師 (00408949)
|
Keywords | 多重ピッチ推定 / 音楽スペクトル解析 / 手書き漢字・数式認識 / 調波・時間構造化クラスタリング / Specmurt法 / 自動伴奏 / 自動採譜 / 時間並行多重音信号 |
Research Abstract |
この研究は、主に多重音(和音など)や同時並行(伴奏など)を含む音楽信号と音楽情報を扱うために、多重音信号、多重音構造、時間並行構造を持つ対象の信号処理および情報処理の技術を、確率モデルに基づくアプローチにより新たに開拓し確立することを目的とするもので、人間の聴覚情景分析能力の計算論的モデルとしても大きな意味がある。典型的な応用分野としては、音楽の自動採譜、自動編曲、音楽情報検索、音楽の加工がある。今年度の代表的成果としては、 1.調波・時間構造モデルに基づく多重音の解析手法の開発:調波構造を調和拘束(倍音関係)つきの混合ガウス分布で表現し、時間方向へは連接条件を満たす混合ガウス分布で表現した音響オブジェクトモデルのパラメータ値をEMアルゴリズムにより推定するポリフォニック音楽音響信号の解析法(HTC : Harmonic-Temporal-structured Clustering法)を確立した。 2.対数周波数逆畳み込みに基づく多重音の解析手法(Specmurt法)の収束性と安定性の解析と改善:多重ピッチ解析において倍音のみを抑圧するフィルタを対数周波数軸上での共通調波構造の逆畳み込みによって実現する手法において、共通調波構造を安定に推定する手法を開発した。 3.トップダウン音楽リズム認識、楽譜復元と、手書き数式認識の間のアナロジーの解明:多声音楽は音符の縦の積み重ねと横の貼り合わせで多層的に成り立つと考えて確率文脈自由文法として扱い、同時にその手法の応用として、手書き数式の認識も同型の問題として解けることを示した。 4.確率的モデル化に基づく伴奏の自動演奏:人間の演奏のテンポ変動、弾き間違い、弾き直しなどは確率的現象として定式化して楽譜中の現在位置を最尤推定し、それに合わせて伴奏パートをMIDI自動再生する手法を開発した。
|
Research Products
(16 results)