• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

スパース信号分解に基づく多次元音響メディア情報処理及びその音拡張現実感への応用

Research Project

Project/Area Number 14J10796
Research InstitutionThe Graduate University for Advanced Studies

Principal Investigator

北村 大地  総合研究大学院大学, 複合科学研究科, 特別研究員(DC1)

Project Period (FY) 2014-04-25 – 2017-03-31
Keywords音源分離 / 音メディア信号処理 / 非負値行列因子分解 / 多チャネル
Outline of Annual Research Achievements

本研究は,音メディアを対象とした拡張現実感システム(音ARシステム)の構築を最終的な目標としており,頑健に動作する教師無し及び教師あり音源分離技術の基礎的な理論構築及びマルチチャネル信号への拡張をを行う.このような音源分離技術は,補聴器等の人支援デバイスや高臨場感音場再現技術,既存の音楽の能動的な鑑賞(ユーザによるリマスタリング)など多岐にわたる応用が可能である他,混合信号の中の潜在的な因子を解析する技術として,学術的にも極めて重要である.研究実施1年目では,マルチチャネル信号を対象とした極めて効率的な教師無し音源分離アルゴリズムを新たに提案しており,トップ国際会議への採択や当該成果に関する受賞等から,その学術的な価値が認められつつある.
2年目では,1年目で提案したマルチチャネル音源分離手法の数理的なメカニズム(音源の周波数構造を捉える機構及び空間的な伝達系を捉える機構)を詳しく解析し,トイモデルを用いて従来のstate-of-the-artな手法(独立ベクトル分析)からの数理的な拡張である事実を明確に示した.この成果は1年目の成果とまとめて国際論文誌へ投稿済みである.また,異なるアプローチである教師ありの音源分離手法として,分離対象音源固有の周波数構造を捉えるように教師情報(音源固有のスペクトル構造)を変形・適応することで,より高精度なモノラル音源分離を実現する手法を新たに提案している.また,国際会議への投稿を予定しており,現在原稿を投稿中である.この他にも,教師あり及び教師無し音源分離手法の基盤数理アルゴリズムである非負値行列因子分解に関して,効率的な最適化を可能にする初期値の決定法に関しても取り組んでおり,同様に国際会議原稿を現在執筆中である.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初の研究計画では,教師あり音源分離に関する性能向上を最も大きな課題としており,分離目的音の教師信号(サンプル音等)から得られた教師スペクトル情報をより効率的に分離ができるように変形及び適応することを計画していた.現在の状況は,次の通りである.
研究実施1年目に,非常に効率的な教師無し多チャネル音源分離手法を提案し,従来の最先端技術の最高性能を大きく上回っていることを示した.また2年目では,当初の計画通り教師あり音源分離手法に着目し,分離目的音の教師スペクトル情報をより識別的な構造に適応的に変形する手法を提案した.識別的な構造に変形させることで,非目的音源のスペクトル成分とのオーバーラップを避けることができ,学習した教師情報が他の音源を表現してしまう問題を解決している.音楽信号を用いた分離実験の結果,本手法は従来の教師あり音源分離手法の性能を大きく上回ることが確認され,その妥当性を客観的に示すことができている.
これらの教師無し及び教師あり音源分離手法は,統合することが可能であり,その場合は一般的な音楽信号のようにステレオ(2チャネル)で録音された信号に対して適用することが可能となる.また,補聴器や音場再現技術を対象とした場合も同様に適用可能である.このように単一チャネルと多チャネルの両方の問題について同時に取り組むことができており,当初の計画よりも大きく進展した進捗状況となっている.

Strategy for Future Research Activity

研究実施2年目で提案した教師あり音源分離手法は,より識別的な教師情報を学習するために,学習済みの教師情報を,目的音源固有のスペクトル成分を捉えるように変形・適応する手法であり,確実に分離精度が向上することを客観的に示している.しかしながら,現状では変形・適応の数理的な最適化部分を近似的に解いているため,性能向上が最適化の途中で止まってしまうという現象を実験的に確認している.従って,3年目ではまず,前述の最適化の厳密な解を数値計算によって求めることで,従来法からの性能向上の上限を確認する.さらに,そのような解を推定する新しい最適化アルゴリズムについて考察し,現実的に応用可能な手法へと改良することを目標とする.さらに,1年目で提案した多チャネル音源分離手法と統合することで,具体的な音源分離システム(補聴器,ロボット,及び簡易なソフトウェア等)への導入の可能性について検討する.

  • Research Products

    (15 results)

All 2016 2015 Other

All Presentation (13 results) (of which Int'l Joint Research: 3 results) Remarks (2 results)

  • [Presentation] ランク1空間モデル制約付き多チャネルNMFを用いた柔軟索状ロボットにおける雑音抑圧2016

    • Author(s)
      高草木萌, 北村大地, 小野順貴, 山田武志, 牧野昭二, 猿渡洋
    • Organizer
      ロボティクス・メカトロニクス講演会 (ROBOMECH2016)
    • Place of Presentation
      パシフィコ横浜
    • Year and Date
      2016-06-08 – 2016-06-11
  • [Presentation] 半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法2016

    • Author(s)
      北村大地, 小野順貴, 猿渡洋, 高橋祐, 近藤多伸
    • Organizer
      IEICE Technical Report
    • Place of Presentation
      別府国際コンベンションセンター B-ConPlaza
    • Year and Date
      2016-03-28 – 2016-03-29
  • [Presentation] ランク1空間モデル制約付き多チャネルNMFを用いた雑音抑圧の柔軟索状ロボットへの適用2016

    • Author(s)
      高草木萌, 北村大地, 小野順貴, 山田武志, 牧野昭二, 猿渡洋
    • Organizer
      電子情報通信学会 2016年総合大会
    • Place of Presentation
      九州大学 伊都キャンパス
    • Year and Date
      2016-03-15 – 2016-03-18
  • [Presentation] 時変な全極モデルを用いた基底変形型教師ありNMFによる音楽信号分離2016

    • Author(s)
      中嶋広明, 北村大地, 高宗典玄, 小山翔一, 猿渡洋, 小野順貴, 高橋祐, 近藤多伸
    • Organizer
      日本音響学会 2016年春季研究発表会, 3-3-11, pp. 635-638
    • Place of Presentation
      桐蔭横浜大学
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] 教師あり多チャネルNMFと統計的音声強調を用いた柔軟索状ロボットにおける音源分離2016

    • Author(s)
      高田一真, 北村大地, 中嶋広明, 小山翔一, 猿渡洋, 小野順貴, 牧野昭二
    • Organizer
      日本音響学会 2016年春季研究発表会, 3-3-2, pp. 609-612
    • Place of Presentation
      桐蔭横浜大学
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] 独立性基準を用いた非負値行列因子分解の効果的な初期値決定法2016

    • Author(s)
      北村大地, 小野順貴
    • Organizer
      日本音響学会 2016年春季研究発表会, 3-3-5, pp. 619-622
    • Place of Presentation
      桐蔭横浜大学
    • Year and Date
      2016-03-09 – 2016-03-11
  • [Presentation] 全極モデルを用いた基底変形型教師ありNMFにおける変形自由度に関する研究2015

    • Author(s)
      中嶋広明, 北村大地, 高宗典玄, 小山翔一, 猿渡洋, 小野順貴, 高橋祐, 近藤多伸
    • Organizer
      IEICE Technical Report, EA2015-42, vol. 115, no. 359, pp. 13-18
    • Place of Presentation
      金沢大学 サテライト・プラザ
    • Year and Date
      2015-12-11 – 2015-12-12
  • [Presentation] 全極モデルを用いた基底変形型教師ありNMFによる音楽信号分離2015

    • Author(s)
      中嶋広明, 北村大地, 高宗典玄, 小山翔一, 猿渡洋, 小野順貴, 高橋祐, 近藤多伸
    • Organizer
      日本音響学会 2015年秋季研究発表会, 3-6-7, pp. 573-576
    • Place of Presentation
      会津大学
    • Year and Date
      2015-09-16 – 2015-09-18
  • [Presentation] ランク1空間近似を用いたBSSにおける音源及び空間モデルの考察2015

    • Author(s)
      北村大地, 猿渡洋, 小野順貴, 澤田宏, 亀岡弘和
    • Organizer
      日本音響学会 2015年秋季研究発表会, 3-6-10, pp. 583-586
    • Place of Presentation
      会津大学
    • Year and Date
      2015-09-16 – 2015-09-18
  • [Presentation] Relaxation of rank-1 spatial constraint in overdetermined blind source separation2015

    • Author(s)
      Daichi Kitamura, Nobutaka Ono, Hiroshi Sawada, Hirokazu Kameoka, Hiroshi Saruwatari
    • Organizer
      The 2015 European Signal Processing Conference (EUSIPCO 2015)
    • Place of Presentation
      Nice, France
    • Year and Date
      2015-08-31 – 2015-09-04
    • Int'l Joint Research
  • [Presentation] The 2015 signal separation evaluation campaign2015

    • Author(s)
      Nobutaka Ono, Zafar Rafii, Daichi Kitamura, Nobutaka Ito, Antoine Liutkus
    • Organizer
      12th International Conference on Latent Variable Analysis and Signal Separation (LVA/ICA 2015)
    • Place of Presentation
      Liberec, Czech
    • Year and Date
      2015-08-25 – 2015-08-28
    • Int'l Joint Research
  • [Presentation] 多チャネル非負値行列因子分解におけるランク1空間モデルの音源分離性能評価2015

    • Author(s)
      北村大地, 小野順貴, 澤田宏, 亀岡弘和, 猿渡洋
    • Organizer
      Proceedings of 107th IPSJ Special Interest Group on Music and Computer (IPSJ-SIGMUS), vol. 2015-MUS-107, no. 31
    • Place of Presentation
      電気通信大学
    • Year and Date
      2015-05-23 – 2015-05-24
  • [Presentation] Efficient multichannel nonnegative matrix factorization exploiting rank-1 spatial model2015

    • Author(s)
      Daichi Kitamura, Nobutaka Ono, Hiroshi Sawada, Hirokazu Kameoka, Hiroshi Saruwatari
    • Organizer
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2015), pp. 276-280
    • Place of Presentation
      Brisbane, Australia
    • Year and Date
      2015-04-19 – 2015-04-24
    • Int'l Joint Research
  • [Remarks] Demonstrations of Research

    • URL

      http://d-kitamura.sakura.ne.jp/demo.htm

  • [Remarks] Demonstrations of Research

    • URL

      http://d-kitamura.sakura.ne.jp/en/demo_en.htm

URL: 

Published: 2016-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi