2016 年度実績報告書

楽器の空間配置制御に基づく楽曲の聴覚印象を多様に変化させる音響空間再生システム

研究課題

研究課題/領域番号	16J11472
研究機関	名古屋大学
研究代表者	大谷健登名古屋大学, 情報科学研究科, 特別研究員(DC2)
研究期間 (年度)	2016-04-22 – 2018-03-31
キーワード	音源分離 / 音源配置操作 / 音源再合成 / ビームフォーミング
研究実績の概要	小型の電子機器の普及・進歩により、様々な場所で音楽を楽しむことが可能となっている一方で、音楽プレーヤ自体はプロの作曲家が提示した楽曲を再生する機能にとどまっている。そこで、楽曲中の楽器音の空間配置の操作により、容易に楽曲の聴覚印象を操作することのできるシステムの構築を目指し、初年度の研究を行った。楽曲中の各楽器音の空間配置を操作するため、楽曲信号から各楽器音信号を分離・抽出する必要があるため、この点についての研究を進めた。本研究でのアプローチとして、まず再混合を仮定した楽曲音源分離手法を提案した。まず、再混合を仮定するため、個々の楽器音への分離ではなく、各楽器音を大きく5つ(ベース，ギター，ドラムス，ボーカル，その他)に分けて考えることとした。本研究では、深層学習を利用して音源分離を行うことを考えた。その際、深層学習モデルの学習に利用する誤差関数に分離音の総和が元の混合音と等しくなるように制約をかけた。結果として、再混合後の信号対歪比が再混合を考慮しないモデルと比べて改善することが確認された。一方で、再混合誤差の重みを大きくしすぎると個々の音源に対する分離性能が低下し、全体の性能が低下してしまうことが分かった。また，ステレオ楽曲信号の仮想的な音源配置に着目し、事前強調を行うことを考えた。楽曲信号の空間的広がりを利用した音源事前強調では、空間情報を利用した音源強調手法であるビームフォーマの利用を考えた。本研究では、深層学習器を利用し各音源信号を最も強調するようなビームフォーマを推定・選択することで、上記の処理の前に音源信号を事前強調することを考えた。結果として、一部の音源については分離性能の向上を確認した一方で、ビームフォーマ推定誤りにより、一部音源分離性能が低下してしまった。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由当初の予定では、今年度に音源分離については終える予定であったが、実際には実用上の性能の問題から次年度も引き続き音源分離について研究を続ける必要が出たため。
今後の研究の推進方策	今後は，CDなどに収録されている楽曲の音源分離について引き続き研究を続けていく。本研究の目的である楽曲の再混合の応用に十分な精度が出たと確認されるまで、深層学習モデルの構造やパラメータのチューニングによって精度の向上を図る予定である。音源分離についての研究が終わり次第、本研究の目的である聴覚印象操作システムの構築に移る。提案するシステムには、ユーザが容易に音源の配置を操作することができるインターフェースが不可欠であると考えられる。その実装の一例として、ユーザに対する推薦機能が考えられる。ユーザからのこれまでの操作履歴情報などを収集・解析することでユーザの好みを分析し、その情報からユーザごとに適切な音源配置を推薦することを考えている。また、現在は空間音響の再現のために頭部伝達関数の利用を考えている。しかしながら、頭部伝達関数には個人性の問題があり、ほかの人に対して適切な頭部伝達関数が、そのユーザにとって適切とは限らない。そのため、今後はこの問題の解決も考えていきたい。

研究成果

(5件)

すべて 2017 2016

すべて学会発表 (4件) (うち国際学会 1件) 産業財産権 (1件)

[学会発表] 深層学習に基づく楽器音信号強調のための死角形成型線形ビームフォーマの選択2017
- 著者名/発表者名
  大谷健登，丹羽健太，武田一哉
- 学会等名
  日本音響学会2017年春季研究発表会
- 発表場所
  明治大学
- 年月日
  2017-03-15 – 2017-03-17
[学会発表] AI framework to arrange audio objects according to listener preferences2016
- 著者名/発表者名
  Kento Ohtani, Kenta Niwa, Kazuya Takeda
- 学会等名
  5th Joint Meeting of the Acoustical Society of America and Acoustical Society of Japan
- 発表場所
  Hilton Hawaiian Village
- 年月日
  2016-11-28 – 2016-12-02
- 国際学会
[学会発表] 音楽体験拡張AI ～深層学習を用いた雑音抑圧量推定に基づく楽器音信号強調～2016
- 著者名/発表者名
  大谷健登，丹羽健太，武田一哉
- 学会等名
  日本音響学会2016年秋季研究発表会
- 発表場所
  富山大学
- 年月日
  2016-09-25 – 2016-09-27
[学会発表] 音楽体験拡張AI ～ユーザの簡易フィードバック情報を利用した楽曲操作パラメータ群の個人化～2016
- 著者名/発表者名
  大谷健登，丹羽健太，武田一哉
- 学会等名
  日本音響学会2016年秋季研究発表会
- 発表場所
  富山大学
- 年月日
  2016-09-25 – 2016-09-27
[産業財産権] 音源強調装置、その方法、及びプログラム2017
- 発明者名
  丹羽健太、大谷健登、武田一哉
- 権利者名
  日本電信電話、名古屋大学
- 産業財産権種類
  特許
- 産業財産権番号
  NTTH285877
- 出願年月日
  2017-02-28

2016 年度 実績報告書

楽器の空間配置制御に基づく楽曲の聴覚印象を多様に変化させる音響空間再生システム

研究代表者

大谷 健登 名古屋大学, 情報科学研究科, 特別研究員(DC2)

現在までの達成度 (区分)

理由

研究成果

[学会発表] 深層学習に基づく楽器音信号強調のための死角形成型線形ビームフォーマの選択2017

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] AI framework to arrange audio objects according to listener preferences2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音楽体験拡張AI ～深層学習を用いた雑音抑圧量推定に基づく楽器音信号強調～2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 音楽体験拡張AI ～ユーザの簡易フィードバック情報を利用した楽曲操作パラメータ群の個人化～2016

著者名/発表者名

学会等名

発表場所

年月日

[産業財産権] 音源強調装置、その方法、及びプログラム2017

発明者名

権利者名

産業財産権種類

産業財産権番号

出願年月日

2016 年度実績報告書

大谷健登名古屋大学, 情報科学研究科, 特別研究員(DC2)