2015 Fiscal Year Annual Research Report
信号処理と記号処理の確率的協働による音楽知能の創発
Project/Area Number |
26700020
|
Research Institution | Kyoto University |
Principal Investigator |
吉井 和佳 京都大学, 情報学研究科, 講師 (20510001)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | ノンパラメトリックベイズ / 機械学習 / 音楽情報処理 |
Outline of Annual Research Achievements |
音楽音響信号を楽譜に変換するための取り組みとして、音響モデルと言語モデルの両面で当初の想定以上の進展があった。まず、音響モデルに関して、無限個のソースと無限個のフィルタからなる複合自己回帰モデル(ソース・フィルタ型NMF)を、人間の聴覚特性に合致する対数周波数軸上で再定式化することに成功した。これにより、自動採譜結果が10%以上向上し、競合する最新手法と同等レベルの性能を達成することができた。本研究成果は、音楽情報処理分野のトップカンファレンスであるISMIR 2015に採択された。また、NMF自体の改良として、尤度関数を複素ガウス分布ではなく、複素t分布に置き換えることにより、初期値依存性が低く、頑健な音源分離を行う手法を開発した。本研究成果は、信号処理分野のトップカンファレンスであるICASSP 2016に採択された。一方、音楽音響信号に対するコード認識に関しても、クロマベクトル特徴量の抽出の前に、あらかじめ歌声・伴奏音・打楽器音に分離しておく方式を考案した。識別器に関しても、通常のHMMではなく、コード遷移にビート位置依存性を考慮し、出力分布にvon MisesーFisher混合分布を用いることにより、大幅な性能向上を達成した。言語モデルに関しては、計算機上で音楽理論を扱うために標準的であったGenerative Theory of Tonal Music (GTTM)を確率的生成モデルの見地からとらえ直すことで、メロディ(一次元の音符系列)に対する確率的文脈自由文法 (PCFG)を定式化することに成功した。従来のGTTMでは、導出規則を人出でチューニングしていたのに対し、提案モデルでは自動的に推論されるにもかかわらず、従来より優れた構文解析精度を達成した。本研究成果も、ICASSP 2016に採択された。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
「研究実績の概要」に述べた通り、音響モデル・言語モデルの両側面で大幅な進展が見られたため、NMF, HMM, PCFGなどを統合するうえでの基盤ができあがった。
|
Strategy for Future Research Activity |
当初の計画通り、音響モデルと言語モデルを統合することにより、音楽音響信号から自動採譜を行うと同時に、コード進行を学習する方式の考案に取り組む。さらに、複旋律音楽に対する音符配置モデルの定式化にも取り組む。
|
Causes of Carryover |
楽譜に対す記号処理に関する研究推進のため、ポスドクを1名半年程度雇用することを急遽決定したので、人件費・謝金が当初の予定より増加した。一方、研究環境的な側面では、現有の機材で十分に対応可能であったので、高額な計算サーバなどの購入は見送ることとなった。
|
Expenditure Plan for Carryover Budget |
本年度はいよいよ大規模なデータ解析を行うステージに移行するため、CPUやGPUの世代交代のタイミングに合わせて、高速な計算サーバの購入を検討する。
|
Research Products
(12 results)