2016 Fiscal Year Annual Research Report
信号処理と記号処理の確率的協働による音楽知能の創発
Project/Area Number |
26700020
|
Research Institution | Kyoto University |
Principal Investigator |
吉井 和佳 京都大学, 情報学研究科, 講師 (20510001)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | ノンパラメトリックベイズ / 機械学習 / 音楽情報処理 |
Outline of Annual Research Achievements |
音楽音響信号を楽譜に変換するための取り組みとして、音響モデルと言語モデルの確率的統合に関して当初の想定以上の進展があった。具体的には、ピアノロールからスペクトログラムが生成される過程を表現するNMFに基づく音響モデルに、調やコード進行からピアノロールが生成される過程を表現する階層HMMに基づく言語モデルを統合することで、統一的な階層ベイズモデルを提案した。実験の結果、提案法により音楽文法の一種であるコード構造が正しく学習され、さらに自動採譜精度が向上することを確かめた。本研究成果は、音楽情報処理分野のトップカンファレンスであるISMIR 2015に採択された。一方、MIDI演奏信号を楽譜に変換するための取り組みとして、演奏モデルと言語モデルの確率的統合にも成功した。具体的には、音符の系列に対して時間的なゆらぎが付加されて実際の発音時刻が生成されるLDSに基づく演奏モデルに、音型の変形を伴う繰り返しにもとづいて音符系列が生成されるHMMに基づく言語モデルを統合することで、統一的な階層ベイズモデルを提案した。実験の結果、従来手法より精度が向上することを確かめた。本研究成果は、信号処理分野の国際会議であるEUSIPCO 2015に採択された。リアルタイムで音楽を認識する技術を応用して、人間と共演することができるダンスロボットの開発にも取り組んだ。本研究成果は、英文ジャーナルであるJRMに採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
「研究実績の概要」に述べた通り、音響モデル・言語モデルの統合に関して大幅に進展が見られたため、この枠組みを他の対象へ応用していく基盤ができあがった。
|
Strategy for Future Research Activity |
当初の計画通り、最終年度は、音響モデルと言語モデルの統合モデルの洗練化をすすめる。特に、歌声F0軌跡から音符系列を推定する際に、同様の方式が利用可能であるかを検討する。さらに、コード進行に関して、従来行われてきたn-gramによるモデルだけではなく、木構造型の解析が可能かどうか検討し、音楽の作曲・編曲支援への応用についても研究をすすめる。
|
Causes of Carryover |
当初は高速な計算サーバを購入予定であったが、他予算にて購入のめどがたったので、最終年度の向けての研究の加速のため、音楽データベースの拡充に使用した。この方針に沿って研究が推進できたが、人件費が想定より少なくて済んだため、繰越金が生じた。
|
Expenditure Plan for Carryover Budget |
計算サーバと楽曲データベースを追加で拡充するのと合わせて、大規模な音響信号データ・楽譜データに対する確率モデルの学習をすすめる予定である。
|
Research Products
(21 results)