• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

A Computational Model of Music Understanding Based on Statistical Grammar and Constructive Semantics

Research Project

Project/Area Number 16H01744
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

東条 敏  北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (90272989)

Co-Investigator(Kenkyū-buntansha) 北原 鉄朗  日本大学, 文理学部, 准教授 (00454710)
吉井 和佳  京都大学, 情報学研究科, 講師 (20510001)
平田 圭二  公立はこだて未来大学, システム情報科学部, 教授 (30396121)
浜中 雅俊  京都大学, 医学研究科, 研究員 (30451686)
長尾 確  名古屋大学, 情報学研究科, 教授 (70343209)
大村 英史  東京理科大学, 理工学部情報科学科, 助教 (90645277)
松原 正樹  筑波大学, 図書館情報メディア系, 助教 (90714494)
Project Period (FY) 2016-04-01 – 2021-03-31
Keywords音楽情報処理 / 文法発見 / 深層学習 / GTTM / メロディー概形 / カデンツ / タイムスパン木 / 確率文脈自由文法
Outline of Annual Research Achievements

音楽における文法として以前より認知されているものには古くより和声進行規則があり,T(トニック)D(ドミナント)S(サブドミナント)に対してTDT,TSDT,TSTなどの並びを規制する規則である.これらは和声規則が確立した古典派時代に遡る規則であり,現代のより自由で広い和声の概念にはそぐわない.H28年度においては,次の方法論により音楽の言語学側面の研究に取り組んだ.
1. 確率付き文脈自由文法による文法獲得: 文法とは生成における規範ではなく,シンボル並びの統計的偏りと考える.従って,生成規則としての文法ではなく,多くの楽譜から学習される音列の規則発見を行った.
2. GTTMにおける木構造生成における深層学習の応用: 本研究において音楽と言語を結び付ける重要な視点は木構造であり,その構造生成理論がGTTMであるが,その生成規則は多分に恣意的であり,定性的である.本年度はニューラルネットワークによるグループ構造解析・拍節構造解析を行い,これらの生成規則の機械学習を実施した.
3. メロディー概形による進行予測: GTTMにおける重要音の選出はボトムアップに行うため,木の上層部に現れるピッチイベント列の重要度は均一性は保証されない.そこでGTTMとは独立な方法で音楽の骨格発見を行い,比較検証を行う必要がある.このテーマにおいてはウェーブレット変換によるメロディー概形発見とI-Rモデルによる進行予測を行った.
4. カデンツ発見の効率化によるプロロンゲーション木の生成: GTTMによって生成される木には二種類があり,タイムスパン木が拍節構造を反映した木,プロロンゲーション木が和声構造を反映した木とされる.両者の変換を行うためには,カデンツを検出する必要があったが,これまでこの作業は取り残されたままであった.本年度は局所カデンツ発見に取り組み,この問題の解決に着手した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究計画上,当初より初年度は(a)確率文脈自由文法による文法発見と(b)和声構造を反映する木による意味構造の記述は平行して進行する予定であったため,この意味では両者の成果は十分に出ており,多数の論文を発表することができた.特に,(a)確率文脈自由文法による楽曲構成規則の発見においては最初から精度の高い計算結果を提示できている.

また(b)和声構造を反映した木の生成においては,(b-i)新たにカデンツ発見のアルゴリズムに着手し,タイムスパン木とプロロンゲーション木を結び付ける研究の端緒となった.また(b-ii)タイムスパン木生成において,近年高い注目を浴びているニューラルネットワークによる深層学習を援用し,こちらも当初より高い精度を出せたことは評価すべきことと思われる.

一方で,CCG(組み合わせカテゴリー文法)を用いた楽曲パーサは,既存の手法との差別化が難しく,早期に方針変更を行うこととした.

Strategy for Future Research Activity

当初,ニューラルネットワークによるグループ構造解析・拍節構造解析は計画段階では重要視していなかったが,期待以上の成果を出していることもあり,ニューラルネットワークの構成を変えてさらに精度向上を試みることとする.
29--30年度は平行して進めてきたさまざまな枠組みの統合を目標とするが,その一つとして,(i) タイムスパン木とプロロンゲーション木の融合・単一化を考察する.GTTMオリジナルな発想においては後者の木は前者の木を変更して得られるものと定義されていたが,その考えに拘ることなく,単一の意味木の提示を行うことを計画する.
また,これまで(ii)メロディー概形とGTTMによる木上層部との比較は着手できないでいたが,こちらもは枠組みの統合の一環として,着手する.
音楽の概括的な認知モデルへの考察と,木構造の他メディアへの応用は急がず,しかし確実に議論を深めていく努力を行うこととする.

  • Research Products

    (55 results)

All 2017 2016 Other

All Int'l Joint Research (1 results) Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (47 results) (of which Int'l Joint Research: 14 results,  Invited: 1 results) Book (2 results) Remarks (1 results)

  • [Int'l Joint Research] Lancaster University/Queen Mary University(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      Lancaster University/Queen Mary University
  • [Journal Article] 類似楽曲の決定木学習に基づく音楽理 論GTTMのグルーピング構造検出システム2017

    • Author(s)
      金森 光平, 星野 准一, 浜中 雅俊
    • Journal Title

      電子通信学会論文誌

      Volume: J100-D Pages: 129-139

    • Peer Reviewed
  • [Journal Article] Audio-Visual Beat Tracking Based on a State-Space Model for a Robot Dancer Performing with a Human Dancer2017

    • Author(s)
      Misato Ohkita, Yoshiaki Bando, Yukara Ikemiya, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • Journal Title

      Journal of Robotics and Mechatronics

      Volume: 29-1 Pages: 125-136

    • Peer Reviewed
  • [Journal Article] 複数人が同一空間で音楽を聴くための選曲・再生システム2016

    • Author(s)
      鈴木 潤一, 北原 鉄朗
    • Journal Title

      情報処理学会論文誌(テクニカルノート)

      Volume: 57-12 Pages: 2526-2530

    • Peer Reviewed
  • [Journal Article] Singing Voice Separation and Vocal F0 Estimation Based on Mutual Combination of Robust Principal Component Analysis and Subharmonic Summation2016

    • Author(s)
      Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      Volume: 24-11 Pages: 2084-2095

    • Peer Reviewed
  • [Presentation] 曲線描画に基づく即興演奏支援システム2017

    • Author(s)
      北原鉄朗, Sergio Giraldo, Rafael Ramirez
    • Organizer
      情報処理学会 インタラクション 2017(インタラクティブ発表), 3-405-57
  • [Presentation] パターン認識を用いた特定のベーシストの特徴の分析2017

    • Author(s)
      松浦 佳輝, 棚橋 徹, 北原鉄朗
    • Organizer
      情報処理学会 第 79 回全国大会, 3L-01
  • [Presentation] LSTM を用いた四声体和声の生成2017

    • Author(s)
      山田 竜郎, 北原 鉄朗, 有江 浩明, 尾形 哲也
    • Organizer
      人工知能学会 2017 年全国大会, 2C3-OS-20a-1
  • [Presentation] ピアノ練習支援のための楽譜表示システムの試作2017

    • Author(s)
      島田 彩女, 松村 ひかる, 森尻 有貴, 北原 鉄朗
    • Organizer
      情報処理学会 第 79 回全国大会, 5L-05
  • [Presentation] 複数ユーザー間での楽曲推薦を実現するミュージックプレイヤー:楽曲類似度の導入と有効性の検証2017

    • Author(s)
      鈴木 潤一, 北原 鉄朗
    • Organizer
      情報処理学会 音楽情報科学 研究報告, 2017-MUS-114-27
  • [Presentation] スマートタンバリン:音と光で 場を盛り上げるカラオケ支援システム2017

    • Author(s)
      栗原 拓也, 横溝 有希子, 竹腰 美夏, 馬場 哲晃, 北原 鉄朗
    • Organizer
      情報処理学会 音楽情報科学 研究報告,2017- MUS-114-3
  • [Presentation] 即興合奏支援システムのためのスマートフォンセンサーを用いた身体動作認識手法2017

    • Author(s)
      水野 創太, 白松 俊, 一ノ瀬 修吾, 北原 鉄朗
    • Organizer
      情報処理学会 第 79 回全国大会, 2ZA-04
  • [Presentation] スマートフォンセンサーを用いた即興合奏のための身体動作認識機構の試作2017

    • Author(s)
      水野 創太, 一ノ瀬 修吾, 白松 俊, 北原 鉄朗
    • Organizer
      情報処理学会 インタラクション 2017(インタラクティブ発表), 3-410-69
  • [Presentation] 最適な多視点カメラワークを自動生成する遠隔ピアノレッスン支援システムの設計と実装2017

    • Author(s)
      松井遼太, 竹川佳成, 平田圭二
    • Organizer
      (社) 情報処理学会 音楽情報科学研究会, 2017-MUS-114, No.23
  • [Presentation] スペクトログラムの階層的クラスタリングを用いたグルーピング構造分析について2017

    • Author(s)
      澤田隼, 竹川佳成, 平田圭二
    • Organizer
      (社) 情報処理学会 音楽情報科学研究会, 2017-MUS-114, No.7
  • [Presentation] DPマッチングのコストに視線情報を反映させた楽譜追跡手法の提案2017

    • Author(s)
      寺崎栞里, 竹川佳成, 平田圭二
    • Organizer
      (社) 情報処理学会 音楽情報科学研究会, 2017-MUS-114, No.2
  • [Presentation] Revisiting Cadential Retention in GTTM2016

    • Author(s)
      Matsubara, M., Kodama, T. and Tojo, S.
    • Organizer
      IEEE Conference on Knowledge and Systems Engineering, pp. 218-223, Hanoi
    • Int'l Joint Research
  • [Presentation] Harmonic Analysis based on Tonal Pitch Space2016

    • Author(s)
      Sakamoto, S., Matsubara, M., Arn, S. and Tojo, S.
    • Organizer
      IEEE Conference on Knowledge and Systems Engineering, pp. 230-233, Hanoi
    • Int'l Joint Research
  • [Presentation] 統計的文法理論と構成的意味論に基づく音楽理解の計算モデル2016

    • Author(s)
      東条敏, 平田圭二, 浜中雅俊, 長尾確, 北原鉄朗, 大村英史, 松原正樹, 吉井和佳
    • Organizer
      情報処理学会研究報告, Vol. 2016-MUS-112, No. 4, pp. 1-6
  • [Presentation] GTTMにおけるカデンツ発見アルゴリズム2016

    • Author(s)
      松原正樹, 東条敏, 小玉昂史
    • Organizer
      第30回人工知能学会全国大会論文集, No. 3G4-OS-15b-2, pp. 1-4
  • [Presentation] Generative Music System with Quantitative Controllers Based on Expectation for Pitch and Rhythm Structure2016

    • Author(s)
      H. Ohmura, T. Shibayama, and T. Hamano
    • Organizer
      Proceeding of The Eighth International Conference on Knowledge and Systems Engineering (KSE2016), Hanoi, Vietnam
    • Int'l Joint Research
  • [Presentation] 音高と音価の情報量操作による音楽と言語の構造2016

    • Author(s)
      大村英史, 柴山拓郎
    • Organizer
      第30回人工知能学会全国大会, 3G3-OS-15a-1, 北九州
  • [Presentation] A Machine Learning Approach toSupport Music Creation by Musically Untrained People2016

    • Author(s)
      Tetsuro Kitahara and Yuichi Tsuchiya
    • Organizer
      Proceedings of the Constructive Machine Learning Workshop, in conjunction with NIPS 2016
    • Int'l Joint Research
  • [Presentation] Towards Intuitive Music Creation Tools for Musically Untrained People2016

    • Author(s)
      Tetsuro Kitahara
    • Organizer
      Digital Music Research Network One-day Workshop 2016 (DMRN+11)
  • [Presentation] Melodic Contour Extraction using Discrete Wavelet Transform and its Application to Melodic Similarity2016

    • Author(s)
      Kitahara, T. and Matsubara, M.
    • Organizer
      9th International Workshop on Machine Learning and Music, pp. 31-35, Riba del Garda
    • Int'l Joint Research
  • [Presentation] Extracting Melodic Contour Using Wavelet-based Multi-resolution Analysis2016

    • Author(s)
      Tetsuro Kitahara and Masaki Matsubara
    • Organizer
      Proceedings of the 9th International Workshop on Music and Machine Learning (MML 2016), in conjuction with ECML-PKDD 2016, pp.31--35
    • Int'l Joint Research
  • [Presentation] 音符表現によらない旋律の木構造表現の検討(第2報)2016

    • Author(s)
      北原 鉄朗
    • Organizer
      人工知能学会第30回全国大会(JSAI2016), 3G3-OS-15a-3
  • [Presentation] A Bluetooth-Networked Music Player for Playing Musical Pieces Stored in Separate Devices2016

    • Author(s)
      Junichi Suzuki and Tetsuro Kitahara
    • Organizer
      Proceedings of the 8th IEEE International Conference on Knowledge and Systems Engineering (KSE 2016)
    • Int'l Joint Research
  • [Presentation] Smart Loop Sequencer: An Audio-based Approach for Ease of Music Creation2016

    • Author(s)
      Tetsuro Kitahara
    • Organizer
      6th Joint Meething of the Acoustical Society of America (ASA) and the Acoustical Society of Japan (ASJ)
    • Int'l Joint Research / Invited
  • [Presentation] A Tambourine Support System to Improve the Atmosphere of Karaoke: Support of Play by Multiple Players2016

    • Author(s)
      Takuya Kurihara, Yukiko Yokomizo, Minatsu Takekoshi, Tetsuaki Baba, and Tetsuro Kitahara
    • Organizer
      Proceedings of the 8th IEEE International Conference on Knowledge and Systems Engineering (KSE 2016)
    • Int'l Joint Research
  • [Presentation] deepGTTM-II: Automatic Generation of Metrical Structure based on Deep Learing Technique2016

    • Author(s)
      Masatoshi Hamanaka, Keiji Hirata, Satashi Tojo
    • Organizer
      Sound and Music Conference (SMC2016) pp. 221-249
    • Int'l Joint Research
  • [Presentation] deepGTTM-I: Local Boundaries Analyzer based on Deep Learning Technique2016

    • Author(s)
      Masatoshi Hamanaka, Keiji Hirata, Satashi Tojo
    • Organizer
      13th International Symposium on Computer Music Multidisciplinary Research(CMMR2016),pp. 8-20
    • Int'l Joint Research
  • [Presentation] deepGTTM-II: ディープラーニングに基づく拍節 構造分析器2016

    • Author(s)
      浜中雅俊, 平田圭二,東条敏
    • Organizer
      情報処理学会 音楽情報科学研究会研究報告 2016-MUS-112, Vol. 2016, No.5, pp. 1-8
  • [Presentation] クラスタリングと機械学習を用いた音楽理論 GTTMに基づく楽曲構造分析システム2016

    • Author(s)
      金森光平, 浜中雅俊, 星野准一
    • Organizer
      情報処理学会音楽情報科学研究会 研究報 告 2016-MUS-110-18, Vol. 2016, No.18
  • [Presentation] Rhythm Transcription of Polyphonic MIDI Performances Based on a Merged-Output HMM for Multiple Voices2016

    • Author(s)
      Eita Nakamura, Kazuyoshi Yoshii, Shigeki Sagayama
    • Organizer
      Sound and Music Computing Conference (SMC), pp. 338-343
    • Int'l Joint Research
  • [Presentation] Rhythm Transcription of MIDI Performances Based on Hierarchical Bayesian Modelling of Repetition and Modification of Musical Note Patterns2016

    • Author(s)
      Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • Organizer
      European Signal Processing Conference (EUSIPCO), pp. 1946-1950
    • Int'l Joint Research
  • [Presentation] A Hierarchical Bayesian Model of Chords, Pitches, and Spectrograms for Multipitch Analysis2016

    • Author(s)
      Yuta Ojima, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • Organizer
      International Society for Music Information Retrieval Conference (ISMIR), pp. 309-315
    • Int'l Joint Research
  • [Presentation] Musical Note Estimation for F0 Trajectories of Singing Voices Based on a Bayesian Semi-Beat-Synchronous HMM2016

    • Author(s)
      Ryo Nishikimi, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
    • Organizer
      International Society for Music Information Retrieval Conference (ISMIR), pp. 461-467
  • [Presentation] 音楽音響信号解析のためのディリクレ過程に基づくベイズ潜在成分分析2016

    • Author(s)
      吉井和佳, 中村栄太,糸山克寿, 後藤真孝
    • Organizer
      電子情報通信学会 第19回情報論的学習理論ワークショップ, IBISML2016-68, Vol. 116, No. 300, pp. 155-162
  • [Presentation] 音楽音響信号に対する多重音高推定と和音構造学習のための階層ベイズ音響・言語統合モデル2016

    • Author(s)
      尾島優太, 中村栄太, 糸山克寿, 吉井和佳
    • Organizer
      電子情報通信学会 第19回情報論的学習理論ワークショップ, IBISML2016-92, Vol. 116, No. 300, pp. 329-335
  • [Presentation] 歌声F0軌跡に対する自動採譜のための準ビート同期セグメンタルHMM2016

    • Author(s)
      錦見亮, 中村栄太,糸山克寿, 吉井和佳
    • Organizer
      電子情報通信学会 第19回情報論的学習理論ワークショップ, IBISML2016-93, Vol. 116, No. 300, pp. 155-162
  • [Presentation] 階層ベイズ音響・言語モデルに基づく教師なし音楽理解2016

    • Author(s)
      吉井和佳
    • Organizer
      電子情報通信学会 音声研究会, SP2016-29, Vol. 116, No. 189, pp. 13-18
  • [Presentation] NMF vs PLCA: 多重音生成過程に対する無限因子モデルと無限混合モデル2016

    • Author(s)
      吉井和佳, 中村栄太,糸山克寿, 後藤真孝
    • Organizer
      情報処理学会 第112回音楽情報科学研究会
  • [Presentation] 音型の反復と変形に基づく階層ベイズ音楽言語モデルとMIDI演奏のリズム採譜への応用2016

    • Author(s)
      中村栄太, 糸山克寿, 吉井和佳
    • Organizer
      情報処理学会 第112回音楽情報科学研究会
  • [Presentation] 視聴覚統合ビートトラッキングとリアルタイムコード認識を用いたダンス共演ロボット2016

    • Author(s)
      大喜多美里, 坂東宜昭, 糸山克寿, 吉井和佳
    • Organizer
      情報処理学会 第112回音楽情報科学研究会
  • [Presentation] 調・コード・音高・スペクトログラムの階層ベイズモデルに基づく多重音解析2016

    • Author(s)
      尾島優太, 中村栄太, 糸山克寿, 吉井和佳
    • Organizer
      情報処理学会 第112回音楽情報科学研究会
  • [Presentation] 歌声F0軌跡に対する音符推定のためのベイジアン準ビート同期HMM2016

    • Author(s)
      錦見亮, 中村栄太, 糸山克寿, 吉井和佳
    • Organizer
      情報処理学会 第112回音楽情報科学研究会
  • [Presentation] Retrograde of Melody and Flip Operation for Time-Span Tree2016

    • Author(s)
      Keiji Hirata and Satoshi Tojo
    • Organizer
      Proceedings of the 12th International Symposium on Computer Music Multidisciplinary Research (CMMR 2016), pp.298--305
  • [Presentation] 視線情報を活用した楽譜追跡システムの構築2016

    • Author(s)
      寺崎栞里, 竹川佳成, 平田圭二AC
    • Organizer
      (社) 情報処理学会 音楽情報科学研究会, 2016-MUS-112, No.11
  • [Presentation] GTTMに基づくメロディ音符列の確率的木構造モデル2016

    • Author(s)
      中村栄太, 浜中雅俊, 平田圭二, 吉井和佳
    • Organizer
      2016年度 人工知能学会全国大会(第30回)論文集, 3G3-OS-15b-4
  • [Presentation] 旋律の微分と簡約の導入2016

    • Author(s)
      平田圭二, 大村英史, 北原鉄朗
    • Organizer
      2016年度 人工知能学会全国大会(第30回)論文集, 3G3-OS-15a-4
  • [Presentation] 音楽音響信号を対象とするGTTM的アプローチによるグルーピング構造の抽出について2016

    • Author(s)
      澤田 隼, 竹川佳成, 平田圭二
    • Organizer
      (社) 情報処理学会 音楽情報科学研究会, 2016-MUS-111, No.23
  • [Book] An Algebraic Approach to Time-Span Reduction, in Computational Music Analysis2016

    • Author(s)
      David Meredith (Ed), Keiji Hirata, Satoshi Tojo, and Masatoshi Hamanaka
    • Total Pages
      20
    • Publisher
      Springer
    • ISBN
      978-3-319-25931-4
  • [Book] Implementing Methods for Analysing Music Based on Lerdahl and Jackendoff's Generative Theory of Tonal Music, in Computational Music Analysis2016

    • Author(s)
      David Meredith (Ed), Keiji Hirata, Satoshi Tojo, and Masatoshi Hamanaka
    • Total Pages
      28
    • Publisher
      Springer
    • ISBN
      978-3-319-25931-4
  • [Remarks] GTTM - Generative Theory of Tonal Music

    • URL

      http://gttm.jp/gttm/

URL: 

Published: 2018-12-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi