• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

人間の聴覚システムの模倣に基づく自律的音響信号処理の研究

Research Project

Project/Area Number 15J09992
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeSingle-year Grants
Section国内
Research Field Perceptual information processing
Research InstitutionThe University of Tokyo

Principal Investigator

中村 友彦  東京大学, 情報理工学系研究科, 特別研究員(DC2)

Project Period (FY) 2015-04-24 – 2017-03-31
Project Status Declined (Fiscal Year 2016)
Budget Amount *help
¥1,900,000 (Direct Cost: ¥1,900,000)
Fiscal Year 2016: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2015: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords多重音解析 / 音源分離 / ソースフィルタモデル / 連続ウェーブレット変換 / 位相推定 / 音楽音響信号加工
Outline of Annual Research Achievements

音響信号から重畳された音源信号を分離・同定する多重音解析は,音楽・音声コンテンツの検索など様々なシステムを構築するための基礎技術となりうる.これまで多重音解析に対して聴覚・音響信号処理・機械学習の研究コミュニティで強力なアプローチが提案されてきた.しかし,これらのアプローチで用いられた手がかりは互いに矛盾しないにも関わらず,問題設定や着目する性質の違いによってそれぞれのコミュニティで独立に研究が進められているのが実情である.本研究では,これらの手がかりをまとめ上げ数理的に組み込んだ1つの最適化問題として定式化することで,聴覚・音響信号処理・機械学習にまたがる多重音解析技術の開発に取り組んだ.
本年度は,楽音や音声の生成過程をよく説明できるソースフィルタモデルをいかに連続ウェーブレット変換(CWT)領域で表現するかについて主に検討した.CWTは人間の聴覚フィルタバンクと類似した周波数解像度をもつ時間周波数表現を与えるが,基底波形同士が直交しないためソースフィルタモデルなどの時間領域で定義される信号モデルとの対応関係を導出することが容易ではない.これに対し,解析的な時間信号モデルを元にCWT領域でのソースフィルタモデルを記述することで私が以前提案した手法(Nakamura+2014)を拡張し,ソースフィルタモデル導入の有効性を確認した.この手法は国内研究会で発表賞を受賞した.また,適切な仮定を置くことで基底波形が直交した場合と同様にソースフィルタモデルをCWT領域で表現できることを示した.この手法については査読付き国際会議で発表した.
さらに,振幅スペクトログラムからの位相推定や音声の声道スペクトル推定に関しても新手法を提案し,どちらも国内学会で発表した.これらの成果は博士論文の一部としてまとめ,東京大学大学院情報理工学系研究科研究科長賞を受賞した.

Research Progress Status

翌年度、交付申請を辞退するため、記入しない。

Strategy for Future Research Activity

翌年度、交付申請を辞退するため、記入しない。

Report

(1 results)
  • 2015 Annual Research Report
  • Research Products

    (8 results)

All 2016 2015

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results,  Acknowledgement Compliant: 1 results) Presentation (6 results) (of which Int'l Joint Research: 1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] Real-Time Audio-to-Score Alignment of Music Performances Containing Errors and Arbitrary Repeats and Skips2016

    • Author(s)
      Tomohiko Nakamura, Eita Nakamura, Shigeki Sagayama
    • Journal Title

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      Volume: 24(2) Issue: 2 Pages: 329-339

    • DOI

      10.1109/taslp.2015.2507862

    • Related Report
      2015 Annual Research Report
    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] 高速近似連続ウェーブレット変換による振幅スペクトログラムからの逐次位相推定法2016

    • Author(s)
      中村友彦,亀岡弘和
    • Organizer
      音学シンポジウム2016
    • Place of Presentation
      東海大学高輪キャンパス,東京都港区
    • Year and Date
      2016-05-21
    • Related Report
      2015 Annual Research Report
  • [Presentation] 非負値行列因子分解に基づく欠損データ補間による超解像声道スペクトル推定法2016

    • Author(s)
      中村友彦,亀岡弘和
    • Organizer
      電気情報通信学会 2016年3月 音声/応用音響/信号処理研究会 共催研究会
    • Place of Presentation
      別府国際コンベンションセンター,大分県別府市
    • Year and Date
      2016-03-28
    • Related Report
      2015 Annual Research Report
  • [Presentation] Shifted and Convolutive Non-Negative Matrix Factorization for Monaural Audio Source Separation2016

    • Author(s)
      Tomohiko Nakamura and Hirokazu Kameoka
    • Organizer
      The 41st IEEE International Conference on Acoustics, Speech and Signal Processing
    • Place of Presentation
      Shanghai, China
    • Year and Date
      2016-03-20
    • Related Report
      2015 Annual Research Report
    • Int'l Joint Research
  • [Presentation] 高速近似連続ウェーブレット変換による振幅スペクトログラムに対する実時間位相推定法2016

    • Author(s)
      中村友彦,亀岡弘和
    • Organizer
      日本音響学会2016年度春季研究発表会
    • Place of Presentation
      桐蔭横浜大学,神奈川県横浜市
    • Year and Date
      2016-03-09
    • Related Report
      2015 Annual Research Report
  • [Presentation] 非負値行列因子分解に基づく欠損データ補間による声道スペクトル推定法の検討2016

    • Author(s)
      中村友彦,亀岡弘和
    • Organizer
      日本音響学会2016年度春季研究発表会
    • Place of Presentation
      桐蔭横浜大学,神奈川県横浜市
    • Year and Date
      2016-03-09
    • Related Report
      2015 Annual Research Report
  • [Presentation] 全極スペクトルモデルと擬似周期信号モデルのウェーブレット変換表現を用いた多重音スペクトログラムの調波時間因子分解2015

    • Author(s)
      中村友彦,亀岡弘和
    • Organizer
      音学シンポジウム2015
    • Place of Presentation
      電気通信大学,東京都調布市
    • Year and Date
      2015-05-23
    • Related Report
      2015 Annual Research Report
  • [Patent(Industrial Property Rights)] 声道スペクトル推定装置,声道スペクトル推定方法,及びプログラム2016

    • Inventor(s)
      亀岡弘和,中村友彦
    • Industrial Property Rights Holder
      亀岡弘和,中村友彦
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      2016-031809
    • Filing Date
      2016-02-26
    • Related Report
      2015 Annual Research Report

URL: 

Published: 2015-11-26   Modified: 2024-03-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi