2016 年度実績報告書

信号処理と記号処理の確率的協働による音楽知能の創発

研究課題

研究課題/領域番号	26700020
研究機関	京都大学
研究代表者	吉井和佳京都大学, 情報学研究科, 講師 (20510001)
研究期間 (年度)	2014-04-01 – 2018-03-31
キーワード	ノンパラメトリックベイズ / 機械学習 / 音楽情報処理
研究実績の概要	音楽音響信号を楽譜に変換するための取り組みとして、音響モデルと言語モデルの確率的統合に関して当初の想定以上の進展があった。具体的には、ピアノロールからスペクトログラムが生成される過程を表現するNMFに基づく音響モデルに、調やコード進行からピアノロールが生成される過程を表現する階層HMMに基づく言語モデルを統合することで、統一的な階層ベイズモデルを提案した。実験の結果、提案法により音楽文法の一種であるコード構造が正しく学習され、さらに自動採譜精度が向上することを確かめた。本研究成果は、音楽情報処理分野のトップカンファレンスであるISMIR 2015に採択された。一方、MIDI演奏信号を楽譜に変換するための取り組みとして、演奏モデルと言語モデルの確率的統合にも成功した。具体的には、音符の系列に対して時間的なゆらぎが付加されて実際の発音時刻が生成されるLDSに基づく演奏モデルに、音型の変形を伴う繰り返しにもとづいて音符系列が生成されるHMMに基づく言語モデルを統合することで、統一的な階層ベイズモデルを提案した。実験の結果、従来手法より精度が向上することを確かめた。本研究成果は、信号処理分野の国際会議であるEUSIPCO 2015に採択された。リアルタイムで音楽を認識する技術を応用して、人間と共演することができるダンスロボットの開発にも取り組んだ。本研究成果は、英文ジャーナルであるJRMに採択された。
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由「研究実績の概要」に述べた通り、音響モデル・言語モデルの統合に関して大幅に進展が見られたため、この枠組みを他の対象へ応用していく基盤ができあがった。
今後の研究の推進方策	当初の計画通り、最終年度は、音響モデルと言語モデルの統合モデルの洗練化をすすめる。特に、歌声F0軌跡から音符系列を推定する際に、同様の方式が利用可能であるかを検討する。さらに、コード進行に関して、従来行われてきたn-gramによるモデルだけではなく、木構造型の解析が可能かどうか検討し、音楽の作曲・編曲支援への応用についても研究をすすめる。
次年度使用額が生じた理由	当初は高速な計算サーバを購入予定であったが、他予算にて購入のめどがたったので、最終年度の向けての研究の加速のため、音楽データベースの拡充に使用した。この方針に沿って研究が推進できたが、人件費が想定より少なくて済んだため、繰越金が生じた。
次年度使用額の使用計画	計算サーバと楽曲データベースを追加で拡充するのと合わせて、大規模な音響信号データ・楽譜データに対する確率モデルの学習をすすめる予定である。

研究成果
(21件)

すべて 2017 2016 その他

すべて国際共同研究 (1件) 雑誌論文 (5件) (うち査読あり 3件、オープンアクセス 3件、謝辞記載あり 3件) 学会発表 (15件) (うち国際学会 5件、招待講演 1件)

[国際共同研究] フランス国立情報学自動制御研究所(フランス)
- 国名
  フランス
- 外国機関名
  フランス国立情報学自動制御研究所
[雑誌論文] Audio-Visual Beat Tracking Based on a State-Space Model for a Robot Dancer Performing with a Human Dancer2017
- 著者名/発表者名
  Misato Ohkita, Yoshiaki Bando, Yukara Ikemiya, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
- 雑誌名
  
  Journal of Robotics and Mechatronics
  
  巻: Vol. 29, No. 1 ページ: 125-136
- DOI
  10.20965/jrm.2017.p0125
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] Rhythm Transcription of Polyphonic Music Based on Merged-Output HMM for Multiple Voices2017
- 著者名/発表者名
  Eita Nakamura, Kazuyoshi Yoshii, Shigeki Sagayama
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: Vol. 25, No. 4 ページ: 794-806
- DOI
  10.1109/TASLP.2017.2662479
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] Singing Voice Separation and Vocal F0 Estimation Based on Mutual Combination of Robust Principal Component Analysis and Subharmonic Summation2016
- 著者名/発表者名
  Yukara Ikemiya, Katsutoshi Itoyama, Kazuyoshi Yoshii
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech, and Language Processing
  
  巻: Vol. 24, No. 11 ページ: 2084-2095
- DOI
  10.1109/TASLP.2016.2577879
- 査読あり / オープンアクセス / 謝辞記載あり
[雑誌論文] 音楽と機械学習2016
- 著者名/発表者名
  吉井和佳
- 雑誌名
  
  情報処理学会誌
  
  巻: Vol. 57, No. 6 ページ: 10-13
[雑誌論文] 音楽音響信号解析のためのスパース学習2016
- 著者名/発表者名
  吉井和佳, 糸山克寿
- 雑誌名
  
  電子情報通信学会誌
  
  巻: Vol. 99, No. 5 ページ: 456-460
[学会発表] 音楽音響信号解析のためのディリクレ過程に基づくベイズ潜在成分分析2016
- 著者名/発表者名
  吉井和佳, 中村栄太，糸山克寿, 後藤真孝
- 学会等名
  電子情報通信学会第19回情報論的学習理論ワークショップ
- 発表場所
  京都大学（京都府・京都市）
- 年月日
  2016-11-16 – 2016-11-19
[学会発表] 音楽音響信号に対する多重音高推定と和音構造学習のための階層ベイズ音響・言語統合モデル2016
- 著者名/発表者名
  尾島優太, 中村栄太, 糸山克寿, 吉井和佳
- 学会等名
  電子情報通信学会第19回情報論的学習理論ワークショップ
- 発表場所
  京都大学（京都府・京都市）
- 年月日
  2016-11-16 – 2016-11-19
[学会発表] 歌声F0軌跡に対する自動採譜のための準ビート同期セグメンタルHMM2016
- 著者名/発表者名
  錦見亮, 中村栄太，糸山克寿, 吉井和佳
- 学会等名
  電子情報通信学会第19回情報論的学習理論ワークショップ
- 発表場所
  京都大学（京都府・京都市）
- 年月日
  2016-11-16 – 2016-11-19
[学会発表] Rhythm Transcription of Polyphonic MIDI Performances Based on a Merged-Output HMM for Multiple Voices2016
- 著者名/発表者名
  Eita Nakamura, Kazuyoshi Yoshii, Shigeki Sagayama
- 学会等名
  Sound and Music Computing Conference (SMC)
- 発表場所
  Hamburg, Germany
- 年月日
  2016-08-31 – 2016-09-03
- 国際学会
[学会発表] Rhythm Transcription of MIDI Performances Based on Hierarchical Bayesian Modelling of Repetition and Modification of Musical Note Patterns2016
- 著者名/発表者名
  Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
- 学会等名
  European Signal Processing Conference (EUSIPCO)
- 発表場所
  Budapest, Hungary
- 年月日
  2016-08-28 – 2016-09-02
- 国際学会
[学会発表] 階層ベイズ音響・言語モデルに基づく教師なし音楽理解2016
- 著者名/発表者名
  吉井和佳
- 学会等名
  電子情報通信学会音声研究会
- 発表場所
  京都大学（京都府・京都市）
- 年月日
  2016-08-24 – 2016-08-25
- 招待講演
[学会発表] A Hierarchical Bayesian Model of Chords, Pitches, and Spectrograms for Multipitch Analysis2016
- 著者名/発表者名
  Yuta Ojima, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
- 学会等名
  International Society for Music Information Retrieval Conference (ISMIR)
- 発表場所
  New York, USA
- 年月日
  2016-08-07 – 2016-08-11
- 国際学会
[学会発表] Musical Note Estimation for F0 Trajectories of Singing Voices Based on a Bayesian Semi-Beat-Synchronous HMM2016
- 著者名/発表者名
  Ryo Nishikimi, Eita Nakamura, Katsutoshi Itoyama, Kazuyoshi Yoshii
- 学会等名
  International Society for Music Information Retrieval Conference (ISMIR)
- 発表場所
  New York, USA
- 年月日
  2016-08-07 – 2016-08-11
- 国際学会
[学会発表] Musical Typicality: How Many Similar Songs Exist?. International Society for Music Information Retrieval Conference (ISMIR)2016
- 著者名/発表者名
  Tomoyasu Nakano, Daichi Mochihashi, Kazuyoshi Yoshii, Masataka Goto
- 学会等名
  International Society for Music Information Retrieval Conference (ISMIR)
- 発表場所
  New York, USA
- 年月日
  2016-08-07 – 2016-08-11
- 国際学会
[学会発表] NMF vs PLCA: 多重音生成過程に対する無限因子モデルと無限混合モデル2016
- 著者名/発表者名
  吉井和佳, 中村栄太，糸山克寿, 後藤真孝
- 学会等名
  情報処理学会第112回音楽情報科学研究会
- 発表場所
  東京理科大学（千葉県・野田市）
- 年月日
  2016-07-30 – 2016-08-01
[学会発表] 音型の反復と変形に基づく階層ベイズ音楽言語モデルとMIDI演奏のリズム採譜への応用2016
- 著者名/発表者名
  中村栄太, 糸山克寿, 吉井和佳
- 学会等名
  情報処理学会第112回音楽情報科学研究会
- 発表場所
  東京理科大学（千葉県・野田市）
- 年月日
  2016-07-30 – 2016-08-01
[学会発表] 視聴覚統合ビートトラッキングとリアルタイムコード認識を用いたダンス共演ロボット2016
- 著者名/発表者名
  大喜多美里, 坂東宜昭, 糸山克寿, 吉井和佳
- 学会等名
  情報処理学会第112回音楽情報科学研究会
- 発表場所
  東京理科大学（千葉県・野田市）
- 年月日
  2016-07-30 – 2016-08-01
[学会発表] 歌声F0軌跡に対する音符推定のためのベイジアン準ビート同期HMM2016
- 著者名/発表者名
  錦見亮, 中村栄太, 糸山克寿, 吉井和佳
- 学会等名
  情報処理学会第112回音楽情報科学研究会
- 発表場所
  東京理科大学（千葉県・野田市）
- 年月日
  2016-07-30 – 2016-08-01
[学会発表] 調・コード・音高・スペクトログラムの階層ベイズモデルに基づく多重音解析2016
- 著者名/発表者名
  尾島優太, 中村栄太, 糸山克寿, 吉井和佳
- 学会等名
  情報処理学会第112回音楽情報科学研究会
- 発表場所
  東京理科大学（千葉県・野田市）
- 年月日
  2016-07-30 – 2016-08-01
[学会発表] 統計的文法理論と構成的意味論に基づく音楽理解の計算モデル2016
- 著者名/発表者名
  東条敏, 平田圭二, 浜中雅俊, 長尾確, 北原鉄朗, 大村英史, 松原正樹, 吉井和佳
- 学会等名
  情報処理学会第112回音楽情報科学研究会
- 発表場所
  東京理科大学（千葉県・野田市）
- 年月日
  2016-07-30 – 2016-08-01

2016 年度 実績報告書

信号処理と記号処理の確率的協働による音楽知能の創発

研究代表者

吉井 和佳 京都大学, 情報学研究科, 講師 (20510001)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] フランス国立情報学自動制御研究所(フランス)

国名

外国機関名

[雑誌論文] Audio-Visual Beat Tracking Based on a State-Space Model for a Robot Dancer Performing with a Human Dancer2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Rhythm Transcription of Polyphonic Music Based on Merged-Output HMM for Multiple Voices2017

著者名/発表者名

雑誌名

DOI

[雑誌論文] Singing Voice Separation and Vocal F0 Estimation Based on Mutual Combination of Robust Principal Component Analysis and Subharmonic Summation2016

著者名/発表者名

雑誌名

DOI

[雑誌論文] 音楽と機械学習2016

著者名/発表者名

雑誌名

[雑誌論文] 音楽音響信号解析のためのスパース学習2016

著者名/発表者名

雑誌名

[学会発表] 音楽音響信号解析のためのディリクレ過程に基づくベイズ潜在成分分析2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音楽音響信号に対する多重音高推定と和音構造学習のための階層ベイズ音響・言語統合モデル2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 歌声F0軌跡に対する自動採譜のための準ビート同期セグメンタルHMM2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Rhythm Transcription of Polyphonic MIDI Performances Based on a Merged-Output HMM for Multiple Voices2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Rhythm Transcription of MIDI Performances Based on Hierarchical Bayesian Modelling of Repetition and Modification of Musical Note Patterns2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 階層ベイズ音響・言語モデルに基づく教師なし音楽理解2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Hierarchical Bayesian Model of Chords, Pitches, and Spectrograms for Multipitch Analysis2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Musical Note Estimation for F0 Trajectories of Singing Voices Based on a Bayesian Semi-Beat-Synchronous HMM2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Musical Typicality: How Many Similar Songs Exist?. International Society for Music Information Retrieval Conference (ISMIR)2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] NMF vs PLCA: 多重音生成過程に対する無限因子モデルと無限混合モデル2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音型の反復と変形に基づく階層ベイズ音楽言語モデルとMIDI演奏のリズム採譜への応用2016

著者名/発表者名

2016 年度実績報告書

吉井和佳京都大学, 情報学研究科, 講師 (20510001)