2015 年度実績報告書

人間の聴覚システムの模倣に基づく自律的音響信号処理の研究

研究課題

研究課題/領域番号	15J09992
研究機関	東京大学
研究代表者	中村友彦東京大学, 情報理工学系研究科, 特別研究員(DC2)
研究期間 (年度)	2015-04-24 – 2017-03-31
キーワード	多重音解析 / 音源分離 / ソースフィルタモデル / 連続ウェーブレット変換 / 位相推定 / 音楽音響信号加工
研究実績の概要	音響信号から重畳された音源信号を分離・同定する多重音解析は，音楽・音声コンテンツの検索など様々なシステムを構築するための基礎技術となりうる．これまで多重音解析に対して聴覚・音響信号処理・機械学習の研究コミュニティで強力なアプローチが提案されてきた．しかし，これらのアプローチで用いられた手がかりは互いに矛盾しないにも関わらず，問題設定や着目する性質の違いによってそれぞれのコミュニティで独立に研究が進められているのが実情である．本研究では，これらの手がかりをまとめ上げ数理的に組み込んだ1つの最適化問題として定式化することで，聴覚・音響信号処理・機械学習にまたがる多重音解析技術の開発に取り組んだ．本年度は，楽音や音声の生成過程をよく説明できるソースフィルタモデルをいかに連続ウェーブレット変換（CWT）領域で表現するかについて主に検討した．CWTは人間の聴覚フィルタバンクと類似した周波数解像度をもつ時間周波数表現を与えるが，基底波形同士が直交しないためソースフィルタモデルなどの時間領域で定義される信号モデルとの対応関係を導出することが容易ではない．これに対し，解析的な時間信号モデルを元にCWT領域でのソースフィルタモデルを記述することで私が以前提案した手法（Nakamura+2014）を拡張し，ソースフィルタモデル導入の有効性を確認した．この手法は国内研究会で発表賞を受賞した．また，適切な仮定を置くことで基底波形が直交した場合と同様にソースフィルタモデルをCWT領域で表現できることを示した．この手法については査読付き国際会議で発表した．さらに，振幅スペクトログラムからの位相推定や音声の声道スペクトル推定に関しても新手法を提案し，どちらも国内学会で発表した．これらの成果は博士論文の一部としてまとめ，東京大学大学院情報理工学系研究科研究科長賞を受賞した．
現在までの達成度 (段落)	翌年度、交付申請を辞退するため、記入しない。
今後の研究の推進方策	翌年度、交付申請を辞退するため、記入しない。

研究成果
(8件)

すべて 2016 2015

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件、謝辞記載あり 1件) 学会発表 (6件) (うち国際学会 1件) 産業財産権 (1件)

[雑誌論文] Real-Time Audio-to-Score Alignment of Music Performances Containing Errors and Arbitrary Repeats/Skips2016
- 著者名/発表者名
  Tomohiko Nakamura, Eita Nakamura and Shigeki Sagayama
- 雑誌名
  
  IEEE/ACM Transactions on Audio, Speech and Language Processing
  
  巻: 24 (2) ページ: 329--339
- DOI
  10.1109/TASLP.2015.2507862
- 査読あり / オープンアクセス / 謝辞記載あり
[学会発表] 高速近似連続ウェーブレット変換による振幅スペクトログラムからの逐次位相推定法2016
- 著者名/発表者名
  中村友彦，亀岡弘和
- 学会等名
  音学シンポジウム2016
- 発表場所
  東海大学高輪キャンパス，東京都港区
- 年月日
  2016-05-21 – 2016-05-22
[学会発表] 非負値行列因子分解に基づく欠損データ補間による超解像声道スペクトル推定法2016
- 著者名/発表者名
  中村友彦，亀岡弘和
- 学会等名
  電気情報通信学会　2016年3月　音声/応用音響/信号処理研究会　共催研究会
- 発表場所
  別府国際コンベンションセンター，大分県別府市
- 年月日
  2016-03-28 – 2016-03-29
[学会発表] Shifted and Convolutive Non-Negative Matrix Factorization for Monaural Audio Source Separation2016
- 著者名/発表者名
  Tomohiko Nakamura and Hirokazu Kameoka
- 学会等名
  The 41st IEEE International Conference on Acoustics, Speech and Signal Processing
- 発表場所
  Shanghai, China
- 年月日
  2016-03-20 – 2016-03-25
- 国際学会
[学会発表] 高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法2016
- 著者名/発表者名
  中村友彦，亀岡弘和
- 学会等名
  日本音響学会2016年度春季研究発表会
- 発表場所
  桐蔭横浜大学，神奈川県横浜市
- 年月日
  2016-03-09 – 2016-03-11
[学会発表] 非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討2016
- 著者名/発表者名
  中村友彦，亀岡弘和
- 学会等名
  日本音響学会2016年度春季研究発表会
- 発表場所
  桐蔭横浜大学，神奈川県横浜市
- 年月日
  2016-03-09 – 2016-03-11
[学会発表] 全極スペクトルモデルと擬似周期信号モデルのウェーブレット変換表現を用いた多重音スペクトログラムの調波時間因子分解2015
- 著者名/発表者名
  中村友彦，亀岡弘和
- 学会等名
  音学シンポジウム2015
- 発表場所
  電気通信大学，東京都調布市
- 年月日
  2015-05-23 – 2015-05-24
[産業財産権] 声道スペクトル推定装置，声道スペクトル推定方法，及びプログラム2016
- 発明者名
  亀岡弘和，中村友彦
- 権利者名
  亀岡弘和，中村友彦
- 産業財産権種類
  特許
- 産業財産権番号
  特願2016-031809
- 出願年月日
  2016-02-26

2015 年度 実績報告書

人間の聴覚システムの模倣に基づく自律的音響信号処理の研究

研究代表者

中村 友彦 東京大学, 情報理工学系研究科, 特別研究員(DC2)

研究成果

[雑誌論文] Real-Time Audio-to-Score Alignment of Music Performances Containing Errors and Arbitrary Repeats/Skips2016

著者名/発表者名

雑誌名

DOI

[学会発表] 高速近似連続ウェーブレット変換による振幅スペクトログラムからの逐次位相推定法2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 非負値行列因子分解に基づく欠損データ補間による超解像声道スペクトル推定法2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Shifted and Convolutive Non-Negative Matrix Factorization for Monaural Audio Source Separation2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討2016

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] 全極スペクトルモデルと擬似周期信号モデルのウェーブレット変換表現を用いた多重音スペクトログラムの調波時間因子分解2015

著者名/発表者名

学会等名

発表場所

年月日

[産業財産権] 声道スペクトル推定装置，声道スペクトル推定方法，及びプログラム2016

発明者名

権利者名

産業財産権種類

産業財産権番号

出願年月日

2015 年度実績報告書

中村友彦東京大学, 情報理工学系研究科, 特別研究員(DC2)