2016 Fiscal Year Annual Research Report
音楽文法と楽譜変換の階層ベイズモデルに基づく編曲技能の計算論的解明
Project/Area Number |
16J05486
|
Research Institution | Kyoto University |
Principal Investigator |
中村 栄太 京都大学, 情報学研究科, 特別研究員(PD)
|
Project Period (FY) |
2016-04-22 – 2019-03-31
|
Keywords | 音楽情報処理 / 統計音楽モデル / 音楽言語モデル / 自動編曲 |
Outline of Annual Research Achievements |
平成28年度は、音楽言語モデルの構成・評価とデータ収集を中心に行った。まず、音楽の階層構造を記述する確率的文脈自由文法(PCFG)に基づくモデルの構成を行った。音符単位・動機単位・フレーズ単位などの階層構造を持つ音楽のモデルとして知られているGTTM (Generative Theory of Tonal Music)を計算論的に定式化し、音楽の文法規則をデータから統計的に学習可能なモデルの定式化を行った。音楽専門家による楽曲分析データを用いた評価により、特に局所構造がモデルにより高精度で推定可能であることが示された。 また音楽の大局構造を支配する反復構造を記述するモデルとして、音型の反復と変形に基づく階層ベイズ音楽言語モデルの定式化を行った。これにより各楽曲で特徴的に用いられる音型の統計学習ができ、またシンコペーションといった音楽スタイルを記述する上で重要な要素の記述が可能となった。単旋律楽曲のMIDI演奏データの採譜において最高レベルの認識性能を達成した。 ピアノ編曲に向けたモデルとして、音楽の多声部構造を記述する出力合流HMM(隠れマルコフモデル)を用いた定式化を行ったピアノ演奏MIDIデータからの採譜においてモデル評価を行った結果、特に複数声部間で異なるリズムを持つ音楽(ポリリズム音楽)において顕著な認識精度向上が見られた。また総合的にも最高レベル性能を持つ手法が得られることが分かった。 データ収集に関しては、楽譜データと整合がとれた演奏データ200フレーズ以上とピアノ運指データ20フレーズ以上の収集・整備が既に完了しており、現在増強中である。また研究協力者と共同でポピュラー音楽の電子形式楽譜データおよび音楽家による編曲データの収集も行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究実績の概要の通り、多方面において順調に成果が得られたため。
|
Strategy for Future Research Activity |
引き継づき研究計画の通り進めて行く。また、言語モデルの拡張として、多声部音楽の各音符の音長を記述するモデルの構築も行う。従来は音符の(発音)楽譜位置のみを記述するモデルが広く研究されているが、多声部音楽における音符同士の時間的な複雑な重なり合いを記述するには音長情報が重要である。音長が周辺の音符の楽譜位置や音高に強く依存する点に着目し、音長を予測可能なモデルを構築した。既にピアノ演奏MIDIデータからの採譜における有効性は示されている。今後、演奏音響データからの採譜への応用が期待される。 一方で音楽のスタイルを記述するためには、音符単位のモデルだけではなく、ハーモニーを記述するコード単位のモデルが重要だと考えられる。和音の特徴を記述する和声機能を音楽データから教師なしで学習可能な枠組みを、HMMやPCFGに基づくモデルを用いて定式化する。トニックやドミナントといった伝統的音楽理論で使われる和声機能がデータから自動的に学習可能であることが確認された。今後の自動編曲への応用を進める。
|