研究課題
平成29年度は、まずピアノ音楽などの多声部音楽の各音符の音長を記述するモデルの構築およびその自動採譜への応用を行った。多声部音楽における音符同士の時間的な複雑な重なり合いを記述するには音長情報が重要である。そこで、音長が周辺の音符の楽譜位置や音高に強く依存する点に着目し、音長を予測可能なモデルを構築した。このモデルをピアノ演奏MIDIデータからの採譜に用いた結果、従来手法に比べて大きく認識精度を向上させることを確認した。また、ピアノ音楽の音響信号を楽譜に変換可能な自動採譜手法の開発を行った。また、音楽のスタイルを変換する自動編曲に必要な音楽言語モデル、特に多くの音楽スタイルで重要な要素である和声(ハーモニー)とメロディーのモデル構築を行った。和音のデータから教師なしで機能および文法規則を推論可能な手法を実現するために、HMMおよび確率的文脈自由文法における潜在変数により和音の機能を記述するモデルを考案した。ポピュラー音楽のコード進行データを用いた解析により、これらのモデルを学習した結果、特に、データ量が小さく、和音の機能のカテゴリー数が小さい場合に、その予測性能がマルコフモデルに比べて高くなることを示した。このモデルを用いて、異なる音楽スタイル間の和声の対応関係を学習する手法が開発できると考えられる。一方、メロディーに関しては、音楽で一般的である音符パターンの反復と変形を含む構造を記述するため、変形を含んだパターンを確率的に記述する確率的系列パターンの定式化を行った。このモデルを複数のメロディー・リズム・和声のデータで学習した結果、音楽的に妥当な変形パターンを含む系列パターンが学習されることが確認された。このモデルを拡張して、異なるスタイル間における共通の典型的な音符パターンとスタイルに依存する変形の組み合わせを学習することで、スタイル変換を行う手法の実現が期待される。
2: おおむね順調に進展している
順調に成果が得られているため
引き継づき研究計画の通り進めて行く。これまで進めてきた音楽言語モデルの統合により、様式変換と楽器変換の両側面で編曲アルゴリズムの導出を行う。様式変換においては、潜在的に音楽文法を表す空間を用いた方法により翻訳モデルを構成し、音高空間での単純な距離尺度による類似性に基づくものと比較することにより、この効果を調べる。また、音符パターンとその変形を確率的に定式化したモデルを用いて、局所的モデルでは捉えにくい文法構造に現れる音楽文法規則および編曲の翻訳規則を調べる。楽器変換においては、運指を含む演奏モデルに基づき演奏難易度の定式化を行う。編曲アルゴリズムの評価は、編曲のパラレルデータ(音楽専門家による編曲結果)を用いた客観的評価及び、音楽専門家による採点評価と編曲結果の修正に基づく誤り解析を行う。また、これまでの研究成果をまとめて、システムやデータの整備および一般公開を行う。
すべて 2017 その他
すべて 国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、 査読あり 2件) 学会発表 (13件) (うち国際学会 6件) 備考 (1件)
IEEE/ACM Transactions on Audio, Speech, and Language Processing
巻: 25(4) ページ: 794~806
10.1109/TASLP.2017.2662479
巻: 25(9) ページ: 1846~1858
10.1109/TASLP.2017.2722103
http://eita-nakamura.github.io