人間の聴覚システムの模倣に基づく自律的音響信号処理の研究

Research Project

Project/Area Number	15J09992
Research Category	Grant-in-Aid for JSPS Fellows
Allocation Type	Single-year Grants
Section	国内
Research Field	Perceptual information processing
Research Institution	The University of Tokyo
Principal Investigator	中村友彦東京大学, 情報理工学系研究科, 特別研究員(DC2)
Project Period (FY)	2015-04-24 – 2017-03-31
Project Status	Declined (Fiscal Year 2016)
Budget Amount *help	¥1,900,000 (Direct Cost: ¥1,900,000) Fiscal Year 2016: ¥900,000 (Direct Cost: ¥900,000) Fiscal Year 2015: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords	多重音解析 / 音源分離 / ソースフィルタモデル / 連続ウェーブレット変換 / 位相推定 / 音楽音響信号加工
Outline of Annual Research Achievements	音響信号から重畳された音源信号を分離・同定する多重音解析は，音楽・音声コンテンツの検索など様々なシステムを構築するための基礎技術となりうる．これまで多重音解析に対して聴覚・音響信号処理・機械学習の研究コミュニティで強力なアプローチが提案されてきた．しかし，これらのアプローチで用いられた手がかりは互いに矛盾しないにも関わらず，問題設定や着目する性質の違いによってそれぞれのコミュニティで独立に研究が進められているのが実情である．本研究では，これらの手がかりをまとめ上げ数理的に組み込んだ1つの最適化問題として定式化することで，聴覚・音響信号処理・機械学習にまたがる多重音解析技術の開発に取り組んだ．本年度は，楽音や音声の生成過程をよく説明できるソースフィルタモデルをいかに連続ウェーブレット変換（CWT）領域で表現するかについて主に検討した．CWTは人間の聴覚フィルタバンクと類似した周波数解像度をもつ時間周波数表現を与えるが，基底波形同士が直交しないためソースフィルタモデルなどの時間領域で定義される信号モデルとの対応関係を導出することが容易ではない．これに対し，解析的な時間信号モデルを元にCWT領域でのソースフィルタモデルを記述することで私が以前提案した手法（Nakamura+2014）を拡張し，ソースフィルタモデル導入の有効性を確認した．この手法は国内研究会で発表賞を受賞した．また，適切な仮定を置くことで基底波形が直交した場合と同様にソースフィルタモデルをCWT領域で表現できることを示した．この手法については査読付き国際会議で発表した．さらに，振幅スペクトログラムからの位相推定や音声の声道スペクトル推定に関しても新手法を提案し，どちらも国内学会で発表した．これらの成果は博士論文の一部としてまとめ，東京大学大学院情報理工学系研究科研究科長賞を受賞した．
Research Progress Status	翌年度、交付申請を辞退するため、記入しない。
Strategy for Future Research Activity	翌年度、交付申請を辞退するため、記入しない。

Report

(1 results)

2015 Annual Research Report

Research Products
(8 results)

All 2016 2015

All Journal Article (1 results) (of which Peer Reviewed: 1 results, Open Access: 1 results, Acknowledgement Compliant: 1 results) Presentation (6 results) (of which Int'l Joint Research: 1 results) Patent(Industrial Property Rights) (1 results)

[Journal Article] Real-Time Audio-to-Score Alignment of Music Performances Containing Errors and Arbitrary Repeats and Skips2016
- Author(s)
  Tomohiko Nakamura, Eita Nakamura, Shigeki Sagayama
- Journal Title
  
  IEEE/ACM Transactions on Audio, Speech and Language Processing
  
  Volume: 24(2) Issue: 2 Pages: 329-339
- DOI
  10.1109/taslp.2015.2507862
- Related Report
  2015 Annual Research Report
- Peer Reviewed / Open Access / Acknowledgement Compliant
[Presentation] 高速近似連続ウェーブレット変換による振幅スペクトログラムからの逐次位相推定法2016
- Author(s)
  中村友彦，亀岡弘和
- Organizer
  音学シンポジウム2016
- Place of Presentation
  東海大学高輪キャンパス，東京都港区
- Year and Date
  2016-05-21
- Related Report
  2015 Annual Research Report
[Presentation] 非負値行列因子分解に基づく欠損データ補間による超解像声道スペクトル推定法2016
- Author(s)
  中村友彦，亀岡弘和
- Organizer
  電気情報通信学会　2016年3月　音声/応用音響/信号処理研究会　共催研究会
- Place of Presentation
  別府国際コンベンションセンター，大分県別府市
- Year and Date
  2016-03-28
- Related Report
  2015 Annual Research Report
[Presentation] Shifted and Convolutive Non-Negative Matrix Factorization for Monaural Audio Source Separation2016
- Author(s)
  Tomohiko Nakamura and Hirokazu Kameoka
- Organizer
  The 41st IEEE International Conference on Acoustics, Speech and Signal Processing
- Place of Presentation
  Shanghai, China
- Year and Date
  2016-03-20
- Related Report
  2015 Annual Research Report
- Int'l Joint Research
[Presentation] 高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法2016
- Author(s)
  中村友彦，亀岡弘和
- Organizer
  日本音響学会2016年度春季研究発表会
- Place of Presentation
  桐蔭横浜大学，神奈川県横浜市
- Year and Date
  2016-03-09
- Related Report
  2015 Annual Research Report
[Presentation] 非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討2016
- Author(s)
  中村友彦，亀岡弘和
- Organizer
  日本音響学会2016年度春季研究発表会
- Place of Presentation
  桐蔭横浜大学，神奈川県横浜市
- Year and Date
  2016-03-09
- Related Report
  2015 Annual Research Report
[Presentation] 全極スペクトルモデルと擬似周期信号モデルのウェーブレット変換表現を用いた多重音スペクトログラムの調波時間因子分解2015
- Author(s)
  中村友彦，亀岡弘和
- Organizer
  音学シンポジウム2015
- Place of Presentation
  電気通信大学，東京都調布市
- Year and Date
  2015-05-23
- Related Report
  2015 Annual Research Report
[Patent(Industrial Property Rights)] 声道スペクトル推定装置，声道スペクトル推定方法，及びプログラム2016
- Inventor(s)
  亀岡弘和，中村友彦
- Industrial Property Rights Holder
  亀岡弘和，中村友彦
- Industrial Property Rights Type
  特許
- Industrial Property Number
  2016-031809
- Filing Date
  2016-02-26
- Related Report
  2015 Annual Research Report

人間の聴覚システムの模倣に基づく自律的音響信号処理の研究

Principal Investigator

中村 友彦 東京大学, 情報理工学系研究科, 特別研究員(DC2)

¥1,900,000 (Direct Cost: ¥1,900,000)

Report

Research Products

[Journal Article] Real-Time Audio-to-Score Alignment of Music Performances Containing Errors and Arbitrary Repeats and Skips2016

Author(s)

Journal Title

DOI

Related Report

[Presentation] 高速近似連続ウェーブレット変換による振幅スペクトログラムからの逐次位相推定法2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 非負値行列因子分解に基づく欠損データ補間による超解像声道スペクトル推定法2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] Shifted and Convolutive Non-Negative Matrix Factorization for Monaural Audio Source Separation2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討2016

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Presentation] 全極スペクトルモデルと擬似周期信号モデルのウェーブレット変換表現を用いた多重音スペクトログラムの調波時間因子分解2015

Author(s)

Organizer

Place of Presentation

Year and Date

Related Report

[Patent(Industrial Property Rights)] 声道スペクトル推定装置，声道スペクトル推定方法，及びプログラム2016

Inventor(s)

Industrial Property Rights Holder

Industrial Property Rights Type

Industrial Property Number

Filing Date

Related Report

中村友彦東京大学, 情報理工学系研究科, 特別研究員(DC2)