2019 年度実績報告書

統計的文法理論と構成的意味論に基づく音楽理解の計算モデル

研究課題

研究課題/領域番号	16H01744
研究機関	北陸先端科学技術大学院大学
研究代表者	東条敏北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (90272989)
研究分担者	北原鉄朗日本大学, 文理学部, 准教授 (00454710) 吉井和佳京都大学, 情報学研究科, 准教授 (20510001) 平田圭二公立はこだて未来大学, システム情報科学部, 教授 (30396121) 浜中雅俊国立研究開発法人理化学研究所, 革新知能統合研究センター, チームリーダー (30451686) 長尾確名古屋大学, 情報学研究科, 教授 (70343209) 大村英史東京理科大学, 理工学部情報科学科, 助教 (90645277) 松原正樹筑波大学, 図書館情報メディア系, 助教 (90714494)
研究期間 (年度)	2016-04-01 – 2021-03-31
キーワード	音楽情報処理 / 木構造 / 時系列処理 / 文法理論 / 和声解析
研究実績の概要	文法発見においてはGTTMなどによる分析的な手法に加えて，機械学習による統計的な手法を応用する試みを続けているところであるが，2019年度は比較対照のため音楽家による音楽構造木の分析データを蓄積した．さらに特筆すべきは，構文木生成において楽曲の進行に合わせて漸進的に木を構築していくモデルに行き着いたことであり，我々の認知モデルにも合致した木構造の生成を提案した．この木構造においては，論理学の記号を用いて予測に関するアノテーションを行うことも併せて提案した．論理記号を用いることは，構成的な意味論，すなわち部分木の情報の統合が全体のゲシュタルトを形成するという考え方に沿うものである．また音楽言語モデルを考慮することにより，音楽的に妥当な楽譜を出力できる自動採譜システムの研究を進めた．具体的には，歌声・ドラム自動採譜において，音符系列やドラムパターンに内在する複雑な構造を，深層生成モデルを用いてモデル化することを試みた．さらに，隠れマルコフモデルを用いた和声からのベースパートの生成，ルールベースによる自動編曲システムなどを実現した．上記音楽モデルはより一般的な認知モデルにも発展可能なものである．2019年度は既存曲のピッチ情報から，ピッチ格子空間内にガウシアンに基づくピッチの分布を生成し，既存曲の分析および類似曲の生成を行うシステムを開発した．また，人間の認知特性の一つである聴覚ゲシュタルトを考慮して，複数時系列データの音楽表現の提案を行った．これらの手法は音楽以外のメディアにも応用され，会議における一連の発言の時系列に対してさまざまなメタ情報を収集して分析し，ディスカッションに含まれる重要発言の抽出を行った．さらに機械学習を用いては，活性化関数に振動関数を用いるニューラルネットワークで任意の信号を学習・生成する方式を考案し，そのフィージビリティスタディを行った．
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由楽曲における木構造生成において，漸進的構築モデルを具体化したことは本研究プロジェクト遂行上における重要な進展である．漸進的構築モデルとは曲全体をパーサに一度に渡すことではなく，我々の音楽認知と同様に音楽を聴きながら時間を追って構文木を構築していく方法であり，文法理論と認知モデルの統合への端緒となる．さらに論理記号を用いたことにより，部分木の情報の統合を構成的に全体意味に反映させることができた．また，音楽構造の木構造解析を容易に行うためのWebベースのツールの開発を行い，音楽構造の利用法をデモンストレーションするためのシステムを構築した．我々はかねてより木構造の類似性検証にも成果を挙げており，木構造を確率的に表現し確率分布間の距離として類似性を定義し，相対擬補元を定義するアプローチを検討した．また文法獲得においては，機械学習の成果を援用しており，自動作曲・編曲の複数のタスクに関して，各タスクの性質に合わせて確率モデルやルールベースなどの適切なアプローチを採用して定式化およびシステムの実装を行った．しかしタスクごとに異なる定式化となっているため，より統一的な視点からの定式化が望まれる．さらに，深層生成モデルを用いて大量の楽譜データからそこに内在する文法規則を教師なし学習させる技術について進展があった．認知モデルの構築においては，既存曲の分析を行い，ピッチとリズムの格子空間にガウシアンに基づく確率分布を生成した．また木構造を用いた認知的音楽理論の拡張として，短期記憶や動的な聴取モデルの形式化に取り組んだ．これら認知モデルの応用として会議録解析をおこない，ミーティングレコーダーと呼ばれるシステムを開発して1年間運用し，会議中の発話内容以外に顔特徴や心拍数を測定した．同時に「集中」「混乱」などの心的状態ラベルを発言者に付与した．
今後の研究の推進方策	2020年度は研究計画最終年度であることに鑑み，木の構成と言語学的知見から追及する具体的目標として，以下のように設定する．まず，木の構成において時系列に沿った漸進的な木構築を実装し，木の予測が認知的な音楽の期待感と合致することを示す．このため，木の予測について論理記号を用いたアノテーションを行う．また楽譜データベースの整備を進め，LSTMなどのよりモダンな手法を活用し作編曲の質を改善する．木構造推定の精度を高め，類似性検証のアルゴリズムを研磨することで，信頼性の高い楽曲検索システムを実現する．音楽構造の木構造解析を容易に行うために，構造木を深層学習に基づき自動獲得するシステムを構築する．深層生成モデルを用いて大量の楽譜データからそこに内在する文法規則を教師なし学習させる技術を深めるとともに，他の損額要素であるキー・コード・ビートに関しても包括的かつ同時にモデル化することに取り組む．人間の音楽認知を理解するためにピッチとリズムの格子空間にガウシアンに基づく確率分布を生成し，期待感との関係に結びつけ，IR理論などをもとに音楽的期待感の定式化を行う．木構造を用いた認知的音楽理論の拡張として，短期記憶や動的な聴取モデルの形式化に取り組み，モデルの形式化の評価として計算論的アプローチによる認知的リアリティの有無を検討する．木構造が時系列の応用であることを示すため談話構造理解を行い，会議中の発話とともに心的状態ラベルを付与し発話の重要性との関係を明らかにする．以上の成果は秋季に日本で国際学会International Symposium on Computer Music Multidisciplinary Resaerch (CMMR2020)を開催し，特別なセッションを設けて本研究成果を発表する．また海外よりこの分野の第一線の研究者を招き評価を問う．

研究成果
(45件)

すべて 2020 2019 その他

すべて国際共同研究 (2件) 雑誌論文 (5件) (うち査読あり 4件、オープンアクセス 2件) 学会発表 (36件) (うち国際学会 30件、招待講演 1件) 図書 (2件)

[国際共同研究] Digital and Cognitive Musicology Lab/EPFL/Lausanne(スイス)
- 国名
  スイス
- 外国機関名
  Digital and Cognitive Musicology Lab/EPFL/Lausanne
[国際共同研究] Universidad de Alicante/Alicante(スペイン)
- 国名
  スペイン
- 外国機関名
  Universidad de Alicante/Alicante
[雑誌論文] Statistical Learning and Estimation of Piano Fingering2020
- 著者名/発表者名
  Eita Nakamura, Yasuyuki Saito, Kazuyoshi Yoshii
- 雑誌名
  
  Information Sciences
  
  巻: 517 ページ: 68-85
- DOI
  10.1016/j.ins.2019.12.068
- 査読あり
[雑誌論文] 言語の構文解析から音楽の構造分析へ2020
- 著者名/発表者名
  平田圭二, 東条敏
- 雑誌名
  
  音楽知覚認知研究
  
  巻: 25 ページ: 29-39
[雑誌論文] ゲーム風演出で読書を促進するモバイルアプリケーション2019
- 著者名/発表者名
  草野有沙, 西由佳梨, 北原鉄朗
- 雑誌名
  
  情報処理学会論文誌
  
  巻: 60 ページ: 1978-1982
- 査読あり
[雑誌論文] HamoKara: A System that Enables Amateur Singers to Practice Backing Vocals for Karaoke2019
- 著者名/発表者名
  Mina Shiraishi, Kozue Ogasawara, and Tetsuro Kitahara
- 雑誌名
  
  Journal of Information Processing
  
  巻: 27 ページ: 683-692
- DOI
  10.2197/ipsjjip.27.683
- 査読あり / オープンアクセス
[雑誌論文] A Non-notewise Melody Editing Method for Supporting Musically Untrained People's Music Composition2019
- 著者名/発表者名
  Yusuke Tsuchiya, Tetsuro Kitahara
- 雑誌名
  
  Journal of Creative Music Systems
  
  巻: 3 ページ: 1-25
- DOI
  10.5920/jcms.624
- 査読あり / オープンアクセス
[学会発表] Audio-guided Video Interpolation via Human Pose Features2020
- 著者名/発表者名
  Takayuki Nakatsuka, Masatoshi Hamanaka, Shigeo Morishima
- 学会等名
  15th International Conference on Computer Vision Theory and Applications
- 国際学会
[学会発表] Reading Students’ Multiple Mental States in Conversation from Facial and Heart Rate Cues2020
- 著者名/発表者名
  Shimeng Peng, Shigeki Ohira and Katashi Nagao
- 学会等名
  12th International Conference on Computer Supported Education (CSEDU 2020)
- 国際学会
[学会発表] マルチモーダル情報の統合により技能差に適応する楽譜追跡システム2020
- 著者名/発表者名
  能登楓, 竹川佳成, 平田圭二
- 学会等名
  (社) 情報処理学会音楽情報科学研究会
[学会発表] 学習者の熟達度を予測するピアノ学習支援システムの提案2020
- 著者名/発表者名
  松井遼太, 竹川佳成, 平田圭二, 柳沢豊
- 学会等名
  (社) 情報処理学会音楽情報科学研究会
[学会発表] 合成音声におけるヴィブラートのパラメータ自動推定2020
- 著者名/発表者名
  田中瑞穂, 竹川佳成, 平田圭二
- 学会等名
  (社) 情報処理学会音楽情報科学研究会
[学会発表] 主成分回帰による音楽的緊張モデルの構築と特徴量の同定2020
- 著者名/発表者名
  樋口梨花, 竹川佳成, 平田圭二
- 学会等名
  (社) 情報処理学会音楽情報科学研究会
[学会発表] Development of Agents that Create Melodies based on Estimating Gaussian Functions in the Pitch Space of Consonance2020
- 著者名/発表者名
  Hidefumi Ohmura, Takuro Shibayama, Keiji Hirata, and Satoshi Tojo
- 学会等名
  HAMT, 12th International Conference on Agents and Artificial Intelligence
- 国際学会
[学会発表] Progressive Training in Recurrent Neural Networks for Chord Progression Modeling2020
- 著者名/発表者名
  Trung-Kien Vu, Teeradaj Racharak, Satoshi Tojo, Nguyen Ha Thanh, Nguyen Le Minh
- 学会等名
  12th International Conference on Agents and Artificial Intelligence
- 国際学会
[学会発表] Generating Walking Bass Lines with HMM2019
- 著者名/発表者名
  Ayumi Shiga and Tetsuro Kitahara
- 学会等名
  The 14th International Symposium on Computer Music Multidisciplinary Research (CMMR 2019)
- 国際学会
[学会発表] An Investigation towards Verbally Controllable Equalizer for Singing Voices2019
- 著者名/発表者名
  Seiya Masuda, Eriko Aiba, and Tetsuro Kitahara
- 学会等名
  The 5th Workshop on Intelligent Music Production (WIMP 2019)
- 国際学会
[学会発表] Statistical Music Structure Analysis Based on a Homogeneity-, Repetitiveness-, and Regularity-Aware Hierarchical Hidden Semi-Markov Model2019
- 著者名/発表者名
  Go Shibata, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
- 学会等名
  International Society for Music Information Retrieval Conference (ISMIR)
- 国際学会
[学会発表] Blending Acoustic and Language Model Predictions for Automatic Music Transcription2019
- 著者名/発表者名
  Adrien Ycart, Andrew McLeod, Emmanouil Benetos, Kazuyoshi Yoshii
- 学会等名
  International Society for Music Information Retrieval Conference (ISMIR)
- 国際学会
[学会発表] End-to-End Melody Note Transcription Based on a Beat-Synchronous Attention Mechanism2019
- 著者名/発表者名
  Ryo Nishikimi, Eita Nakamura, Masataka Goto, Kazuyoshi Yoshii
- 学会等名
  IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA)
- 国際学会
[学会発表] Joint Singing Pitch Estimation and Voice Separation Based on a Neural Harmonic Structure Renderer2019
- 著者名/発表者名
  Tomoyasu Nakano, Kazuyoshi Yoshii, Yiming Wu, Ryo Nishikimi, Kin Wah Edward Lin, Masataka Goto
- 学会等名
  IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA)
- 国際学会
[学会発表] Multi-Step Chord Sequence Prediction Based on Aggregated Multi-Scale Encoder-Decoder Networks2019
- 著者名/発表者名
  Tristan Carsault, Andrew McLeod, Philippe Esling, Jerome Nika, Eita Nakamura, Kazuyoshi Yoshii
- 学会等名
  IEEE International Workshop on Machine Learning for Signal Processing (MLSP)
- 国際学会
[学会発表] Automatic Chord Estimation Based on a Frame-wise Convolutional Recurrent Neural Network with Non-Aligned Annotations2019
- 著者名/発表者名
  Yiming Wu, Tristan Carsault, Kazuyoshi Yoshii
- 学会等名
  European Signal Processing Conference (EUSIPCO)
- 国際学会
[学会発表] Automatic Singing Transcription Based on Encoder-Decoder Recurrent Neural Networks with a Weakly-Supervised Attention Mechanism2019
- 著者名/発表者名
  Ryo Nishikimi, Eita Nakamura, Satoru Fukayama, Masataka Goto, Kazuyoshi Yoshii
- 学会等名
  IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
- 国際学会
[学会発表] Joint Transcription of Lead, Bass, and Rhythm Guitars Based on a Factorial Hidden Semi-Markov Model2019
- 著者名/発表者名
  Kentaro Shibata, Ryo Nishikimi, Satoru Fukayama, Masataka Goto, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
- 学会等名
  IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
- 国際学会
[学会発表] Bayesian Drum Transcription Based on Nonnegative Matrix Factor Decomposition with a Deep Score Prior2019
- 著者名/発表者名
  Shun Ueda, Kentaro Shibata, Yusuke Wada, Ryo Nishikimi, Eita Nakamura, Kazuyoshi Yoshii
- 学会等名
  IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
- 国際学会
[学会発表] Unsupervised Melody Style Conversion2019
- 著者名/発表者名
  Eita Nakamura, Kentaro Shibata, Ryo Nishikimi, Kazuyoshi Yoshii
- 学会等名
  IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
- 国際学会
[学会発表] Improved Metrical Alignment of MIDI Performance Based on a Repetition-Aware Online-Adapted Grammar2019
- 著者名/発表者名
  Andrew McLeod, Eita Nakamura, Kazuyoshi Yoshii
- 学会等名
  IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)
- 国際学会
[学会発表] Melody Slot Machine2019
- 著者名/発表者名
  Masatoshi Hamanaka, Takayuki Nakatsuka, Shigeo Morishima
- 学会等名
  ACM Siggraph2019 Emerging Technologies ET-245
- 国際学会
[学会発表] Melody Slot Machine: A Controllable Holographic Virtual Performer2019
- 著者名/発表者名
  Masatoshi Hamanaka
- 学会等名
  Proceedings of the 27th ACM International Conference on Multimedia (MM’19)
- 国際学会
[学会発表] Melody Slot Machine: Melody Morphing by Using Time-span Tree of GTTM2019
- 著者名/発表者名
  Masatoshi Hamanaka
- 学会等名
  International Computer Music Conference (ICMC2019)
- 国際学会
[学会発表] Proposal of an Annotation Method for Integrating Musical Technique Knowledge Using a GTTM Time-Span Tree2019
- 著者名/発表者名
  Nami Iino, Mayumi Shimada, Takuichi Nishimura, Hideki Takeda, Masatoshi Hamanaka
- 学会等名
  Proceedings of the 25th International Conference on MultiMedia Modeling (MMM2019)
- 国際学会
[学会発表] Discussion-skill Analytics with Acoustic, Linguistic and Psychophysiological Data2019
- 著者名/発表者名
  Katashi Nagao, Kosuke Okamoto, Shimeng Peng, Shigeki Ohira
- 学会等名
  11th International Conference on Knowledge Discovery and Information Retrieval (KDIR 2019)
- 国際学会
[学会発表] AI-Powered Education: Smart Learning Environment with Large Interactive Displays2019
- 著者名/発表者名
  Katashi Nagao
- 学会等名
  International Display Workshops 2019
- 国際学会 / 招待講演
[学会発表] Feasibility Study of Deep Frequency Modulation Synthesis2019
- 著者名/発表者名
  Keiji Hirata, Masatoshi Hamanaka, Satoshi Tojo
- 学会等名
  Proceedings of the 14th International Symposium on Computer Music Multidisciplinary Research (CMMR 2019)
- 国際学会
[学会発表] Adaptive Score-Following System by Integrating Gaze Information2019
- 著者名/発表者名
  Kaede Noto, Yoshinari Takegawa, and Keiji Hirata
- 学会等名
  Proceedings of 16th Sound and Music Computing Conference (SMC 2019)
- 国際学会
[学会発表] New Implementation Method for Generalized Frequency Modulation Synthesizer2019
- 著者名/発表者名
  Keiji Hirata
- 学会等名
  The 20th International Society for Music Information Retrieval Conference (ISMIR 2019)
- 国際学会
[学会発表] Auditory Gestalt Formation for Exploring Dynamic Triggering Earthquakes2019
- 著者名/発表者名
  Matsubara, M., Uchide, T. and Morimoto, Y.
- 学会等名
  14th International Symposium on Computer Music Multidisciplinary Research (CMMR2019)
- 国際学会
[学会発表] Modal Logic for Tonal Music2019
- 著者名/発表者名
  Satoshi Tojo
- 学会等名
  14th International Symposium on Computer Music Multidisciplinary Research (CMMR2019)
- 国際学会
[学会発表] Chord Function Identification with Modulation Detection Based on HMM2019
- 著者名/発表者名
  Yui Uehara, Eita Nakamura, and Satoshi Tojo
- 学会等名
  14th International Symposium on Computer Music Multidisciplinary Research (CMMR2019)
- 国際学会
[学会発表] Music Temperaments Evaluation Based on Triads2019
- 著者名/発表者名
  Tong Meihui and Satoshi Tojo
- 学会等名
  The 16th Sound and Music Computing Conference
- 国際学会
[学会発表] Chord Function Identification with Modulation Detection Based on HMM2019
- 著者名/発表者名
  Yui Uehara, Eita Nakamura, and Satoshi Tojo
- 学会等名
  (社) 情報処理学会音楽情報科学研究会
[学会発表] Jazz harmony analysis based on Tonal Pitch Space2019
- 著者名/発表者名
  Hiroyuki Yamamoto, Satoshi Tojo
- 学会等名
  (社) 情報処理学会音楽情報科学研究会
[図書] 人工知能が音楽を創る2019
- 著者名/発表者名
  David Cope, 平田圭二(監訳), 今井慎太郎, 大村英史, 東条敏(訳)
- 総ページ数
  443
- 出版者
  音楽之友社
- ISBN
  978-4-276-21413-2
[図書] 人工知能事典2019
- 著者名/発表者名
  中島秀之他
- 総ページ数
  384
- 出版者
  近代科学社
- ISBN
  978-4-7649-0604-4

2019 年度 実績報告書

統計的文法理論と構成的意味論に基づく音楽理解の計算モデル

研究代表者

東条 敏 北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (90272989)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] Digital and Cognitive Musicology Lab/EPFL/Lausanne(スイス)

国名

外国機関名

[国際共同研究] Universidad de Alicante/Alicante(スペイン)

国名

外国機関名

[雑誌論文] Statistical Learning and Estimation of Piano Fingering2020

著者名/発表者名

雑誌名

DOI

[雑誌論文] 言語の構文解析から音楽の構造分析へ2020

著者名/発表者名

雑誌名

[雑誌論文] ゲーム風演出で読書を促進するモバイルアプリケーション2019

著者名/発表者名

雑誌名

[雑誌論文] HamoKara: A System that Enables Amateur Singers to Practice Backing Vocals for Karaoke2019

著者名/発表者名

雑誌名

DOI

[雑誌論文] A Non-notewise Melody Editing Method for Supporting Musically Untrained People's Music Composition2019

著者名/発表者名

雑誌名

DOI

[学会発表] Audio-guided Video Interpolation via Human Pose Features2020

著者名/発表者名

学会等名

[学会発表] Reading Students’ Multiple Mental States in Conversation from Facial and Heart Rate Cues2020

著者名/発表者名

学会等名

[学会発表] マルチモーダル情報の統合により技能差に適応する楽譜追跡システム2020

著者名/発表者名

学会等名

[学会発表] 学習者の熟達度を予測するピアノ学習支援システムの提案2020

著者名/発表者名

学会等名

[学会発表] 合成音声におけるヴィブラートのパラメータ自動推定2020

著者名/発表者名

学会等名

[学会発表] 主成分回帰による音楽的緊張モデルの構築と特徴量の同定2020

著者名/発表者名

学会等名

[学会発表] Development of Agents that Create Melodies based on Estimating Gaussian Functions in the Pitch Space of Consonance2020

著者名/発表者名

学会等名

[学会発表] Progressive Training in Recurrent Neural Networks for Chord Progression Modeling2020

著者名/発表者名

学会等名

[学会発表] Generating Walking Bass Lines with HMM2019

著者名/発表者名

学会等名

[学会発表] An Investigation towards Verbally Controllable Equalizer for Singing Voices2019

著者名/発表者名

学会等名

[学会発表] Statistical Music Structure Analysis Based on a Homogeneity-, Repetitiveness-, and Regularity-Aware Hierarchical Hidden Semi-Markov Model2019

著者名/発表者名

学会等名

[学会発表] Blending Acoustic and Language Model Predictions for Automatic Music Transcription2019

著者名/発表者名

学会等名

[学会発表] End-to-End Melody Note Transcription Based on a Beat-Synchronous Attention Mechanism2019

著者名/発表者名

学会等名

[学会発表] Joint Singing Pitch Estimation and Voice Separation Based on a Neural Harmonic Structure Renderer2019

著者名/発表者名

学会等名

[学会発表] Multi-Step Chord Sequence Prediction Based on Aggregated Multi-Scale Encoder-Decoder Networks2019

著者名/発表者名

学会等名

[学会発表] Automatic Chord Estimation Based on a Frame-wise Convolutional Recurrent Neural Network with Non-Aligned Annotations2019

著者名/発表者名

学会等名

[学会発表] Automatic Singing Transcription Based on Encoder-Decoder Recurrent Neural Networks with a Weakly-Supervised Attention Mechanism2019

2019 年度実績報告書

東条敏北陸先端科学技術大学院大学, 先端科学技術研究科, 教授 (90272989)