2016 Fiscal Year Annual Research Report
A Computational Model of Music Understanding Based on Statistical Grammar and Constructive Semantics
Project/Area Number |
16H01744
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
東条 敏 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (90272989)
|
Co-Investigator(Kenkyū-buntansha) |
北原 鉄朗 日本大学, 文理学部, 准教授 (00454710)
吉井 和佳 京都大学, 情報学研究科, 講師 (20510001)
平田 圭二 公立はこだて未来大学, システム情報科学部, 教授 (30396121)
浜中 雅俊 京都大学, 医学研究科, 研究員 (30451686)
長尾 確 名古屋大学, 情報学研究科, 教授 (70343209)
大村 英史 東京理科大学, 理工学部情報科学科, 助教 (90645277)
松原 正樹 筑波大学, 図書館情報メディア系, 助教 (90714494)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 音楽情報処理 / 文法発見 / 深層学習 / GTTM / メロディー概形 / カデンツ / タイムスパン木 / 確率文脈自由文法 |
Outline of Annual Research Achievements |
音楽における文法として以前より認知されているものには古くより和声進行規則があり,T(トニック)D(ドミナント)S(サブドミナント)に対してTDT,TSDT,TSTなどの並びを規制する規則である.これらは和声規則が確立した古典派時代に遡る規則であり,現代のより自由で広い和声の概念にはそぐわない.H28年度においては,次の方法論により音楽の言語学側面の研究に取り組んだ. 1. 確率付き文脈自由文法による文法獲得: 文法とは生成における規範ではなく,シンボル並びの統計的偏りと考える.従って,生成規則としての文法ではなく,多くの楽譜から学習される音列の規則発見を行った. 2. GTTMにおける木構造生成における深層学習の応用: 本研究において音楽と言語を結び付ける重要な視点は木構造であり,その構造生成理論がGTTMであるが,その生成規則は多分に恣意的であり,定性的である.本年度はニューラルネットワークによるグループ構造解析・拍節構造解析を行い,これらの生成規則の機械学習を実施した. 3. メロディー概形による進行予測: GTTMにおける重要音の選出はボトムアップに行うため,木の上層部に現れるピッチイベント列の重要度は均一性は保証されない.そこでGTTMとは独立な方法で音楽の骨格発見を行い,比較検証を行う必要がある.このテーマにおいてはウェーブレット変換によるメロディー概形発見とI-Rモデルによる進行予測を行った. 4. カデンツ発見の効率化によるプロロンゲーション木の生成: GTTMによって生成される木には二種類があり,タイムスパン木が拍節構造を反映した木,プロロンゲーション木が和声構造を反映した木とされる.両者の変換を行うためには,カデンツを検出する必要があったが,これまでこの作業は取り残されたままであった.本年度は局所カデンツ発見に取り組み,この問題の解決に着手した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画上,当初より初年度は(a)確率文脈自由文法による文法発見と(b)和声構造を反映する木による意味構造の記述は平行して進行する予定であったため,この意味では両者の成果は十分に出ており,多数の論文を発表することができた.特に,(a)確率文脈自由文法による楽曲構成規則の発見においては最初から精度の高い計算結果を提示できている.
また(b)和声構造を反映した木の生成においては,(b-i)新たにカデンツ発見のアルゴリズムに着手し,タイムスパン木とプロロンゲーション木を結び付ける研究の端緒となった.また(b-ii)タイムスパン木生成において,近年高い注目を浴びているニューラルネットワークによる深層学習を援用し,こちらも当初より高い精度を出せたことは評価すべきことと思われる.
一方で,CCG(組み合わせカテゴリー文法)を用いた楽曲パーサは,既存の手法との差別化が難しく,早期に方針変更を行うこととした.
|
Strategy for Future Research Activity |
当初,ニューラルネットワークによるグループ構造解析・拍節構造解析は計画段階では重要視していなかったが,期待以上の成果を出していることもあり,ニューラルネットワークの構成を変えてさらに精度向上を試みることとする. 29--30年度は平行して進めてきたさまざまな枠組みの統合を目標とするが,その一つとして,(i) タイムスパン木とプロロンゲーション木の融合・単一化を考察する.GTTMオリジナルな発想においては後者の木は前者の木を変更して得られるものと定義されていたが,その考えに拘ることなく,単一の意味木の提示を行うことを計画する. また,これまで(ii)メロディー概形とGTTMによる木上層部との比較は着手できないでいたが,こちらもは枠組みの統合の一環として,着手する. 音楽の概括的な認知モデルへの考察と,木構造の他メディアへの応用は急がず,しかし確実に議論を深めていく努力を行うこととする.
|
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
[Presentation] 統計的文法理論と構成的意味論に基づく音楽理解の計算モデル2016
Author(s)
東条敏, 平田圭二, 浜中雅俊, 長尾確, 北原鉄朗, 大村英史, 松原正樹, 吉井和佳
Organizer
情報処理学会研究報告, Vol. 2016-MUS-112, No. 4, pp. 1-6
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-