• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実施状況報告書

時空間音響信号モデリングと機械学習に基づく音響情景分析の研究

研究課題

研究課題/領域番号 26730100
研究機関日本電信電話株式会社NTTコミュニケーション科学基礎研究所

研究代表者

亀岡 弘和  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 研究主任 (20466402)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード音響情景分析 / 深層学習 / 多重音解析 / 音響イベント検出 / 音源分離 / 到来方向推定 / 残響除去 / 高速学習アルゴリズム
研究実績の概要

音環境理解(音響情景分析)能力を計算に備えさせることを目的とした,主に以下の研究を行った。
(1)音源分離・残響除去・音響イベント検出・到来方向推定の統合的アプローチ:音源分離,残響除去,音響イベント検出,到来方向推定の問題がそれぞれ相互依存関係にあるという点に着目し,これらを同時最適化問題として統合的に解決するアプローチを世界で初めて提唱した。その効果を実環境実験により示した。
(2)制約付きボルツマンマシンの高速学習アルゴリズム:人間は音環境を理解する上で,周囲の音響信号が何の音であるかを識別するプロセスが存在するが,このような識別能力を深層ニューラルネットワーク(DNN)により模倣するアプローチを検討中である。この検討に向け今年度は特にDNNの学習問題に焦点を当て,DNNの一種である Deep Belief Network (DBN)の新しい高速学習アルゴリズムを提案した。DBNの学習アルゴリズムとして有名なContrastive Divergence法よりも早く収束することを実験的に示した。深層学習のブームが現在世界で加速度的に進んでいるため,この成果のインパクトは大きい。
(3)計算論的聴覚情景分析とスパース表現の統合的アプローチによる多重音解析:人間は音を聴き分ける際,調波性や連続性や近接性といったある特定の条件を満たす時間周波数成分をひとまとまりの音と捉える機能とともに,異なるタイミングで繰り返し起こる時間周波数成分をひとまとまりの音として捉える機能を有している。前者の機能を模倣した多重音解析手法の枠組を計算論的聴覚情景分析といい,後者の機能を模倣した多重音解析手法の枠組をスパース表現アプローチという。これら二つの異なる観点によるアプローチの特長を同時に備えた多重音解析アプローチを世界で初めて提唱し,音楽音響信号の楽音分離実験によりその効果を示した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

研究の構想・ビジョンが明確であり,前年度から計画と準備を入念に行えた点が大きい。また,研究協力者である連携講座学生らの活躍,アクティビティが想定以上であった。

今後の研究の推進方策

音源分離問題の成功の鍵は,いかに現実の音響現象に即した生成過程モデルを構築できるかにある。今後は音声合成における音声の生成過程のモデルをヒントにした音響情景分析アプローチ,波動方程式に基づいた音の時空間モデリングに基づいた音響情景分析アプローチを定式化・実装することを目標としている。また,これらを昨年度に考案したアプローチに組み込み,音源分離,音響イベント検出,音源定位などの各種タスクにおいて世界最高性能を目指す。さらに,これらの技術を小型ハードウェアで実装し,聴覚障がい者向けのウェアラブル音響情景分析デバイスやライフログ音響ダイアライゼーションデバイスを開発することを考えている。

次年度使用額が生じた理由

当初予定していた音の品質の主観評価実験を年度内に実施することを年度末ギリギリまで目指していたが,結局準備が間に合わず,実験参加者に支払う謝金のために確保していた予算を使い切ることができなかった。

次年度使用額の使用計画

上述の主観評価実験を今年度こそは実施する予定である。

  • 研究成果

    (41件)

すべて 2015 2014

すべて 雑誌論文 (4件) (うち査読あり 4件、 謝辞記載あり 1件) 学会発表 (35件) (うち国際学会 2件、 招待講演 1件) 図書 (1件) 産業財産権 (1件)

  • [雑誌論文] Generative modeling of voice fundamental frequency contours2015

    • 著者名/発表者名
      Hirokazu Kameoka, Kota Yoshizato, Tatsuma Ishihara, Kento Kadowaki, Yasunori Ohishi, and Kunio Kashino
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      巻: 23 ページ: 1042-1053

    • DOI

      10.1109/TASLP.2015.2418576

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Multichannel signal separation combining directional clustering and nonnegative matrix factorization with spectrogram restoration2015

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Hirokazu Kameoka, Yu Takahashi, Kazunobu Kondo, Satoshi Nakamura
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      巻: 23 ページ: 654 - 669

    • DOI

      10.1109/TASLP.2015.2401425

    • 査読あり
  • [雑誌論文] Harmonic/Percussive sound separation based on anisotropic smoothness of spectrograms2015

    • 著者名/発表者名
      Hideyuki Tachibana, Hirokazu Kameoka, Nobutaka Ono, Shigeki Sagayama
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech and Language Processing

      巻: 22 ページ: 2059-2073

    • DOI

      10.1109/TASLP.2014.2351131

    • 査読あり
  • [雑誌論文] 非負値行列因子分解とその音響信号処理への応用2014

    • 著者名/発表者名
      亀岡弘和
    • 雑誌名

      日本統計学会和文誌

      巻: 44 ページ: 383-407

    • 査読あり
  • [学会発表] Multi-resolution signal decomposition with time-domain spectrogram factorization2015

    • 著者名/発表者名
      Hirokazu Kameoka
    • 学会等名
      2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2015)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-04-19 – 2015-04-24
    • 国際学会
  • [学会発表] Lp-norm non-negative matrix factorization and its application to singing voice enhancement2015

    • 著者名/発表者名
      Tomohiko Nakamura, and Hirokazu Kameoka
    • 学会等名
      2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2015)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-04-19 – 2015-04-24
    • 国際学会
  • [学会発表] Efficient multichannel nonnegative matrix factorization exploiting rank-1 spatial model2015

    • 著者名/発表者名
      Daichi Kitamura, Nobutaka Ono, Hiroshi Sawada, Hirokazu Kameoka, Hiroshi Saruwatari
    • 学会等名
      2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2015)
    • 発表場所
      Brisbane, Australia
    • 年月日
      2015-04-19 – 2015-04-24
  • [学会発表] 複合ウェーブレットモデルとF0パターン生成過程の確率モデルを用いたテキスト音声合成2015

    • 著者名/発表者名
      門脇健人, 北条伸克, 亀岡弘和
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学 後楽園キャンパス (東京都文京区)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 多チャンネル階乗隠れマルコフモデルによる音源分離・音響イベント検出・残響除去・到来方向推定の統合的アプローチとその性能評価2015

    • 著者名/発表者名
      樋口卓哉, 亀岡弘和
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学 後楽園キャンパス (東京都文京区)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 多チャンネル階乗隠れマルコフモデルのスペクトル包絡事前学習によるセミブラインド音源分離2015

    • 著者名/発表者名
      樋口卓哉, 亀岡弘和
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学 後楽園キャンパス (東京都文京区)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 優決定条件BSSにおけるランク1空間制約の緩和2015

    • 著者名/発表者名
      北村大地, 小野順貴, 澤田宏, 亀岡弘和, 猿渡洋
    • 学会等名
      日本音響学会2015年春季研究発表会
    • 発表場所
      中央大学 後楽園キャンパス (東京都文京区)
    • 年月日
      2015-03-16 – 2015-03-18
  • [学会発表] 多チャンネル階乗隠れマルコフモデルによる音響情景分析のための統合的アプローチ2015

    • 著者名/発表者名
      樋口卓哉, 亀岡弘和
    • 学会等名
      日本音響学会電気音響研究会/電子情報通信学会応用音響研究会
    • 発表場所
      南の美ら花ホテルミヤヒラ(沖縄県石垣市)
    • 年月日
      2015-03-02 – 2015-03-03
  • [学会発表] 全極スペクトルモデルを用いた調波時間因子分解による多重音解析2015

    • 著者名/発表者名
      中村 友彦, 亀岡 弘和
    • 学会等名
      情報処理学会音楽情報科学研究会
    • 発表場所
      甲府富士屋ホテル(山梨県甲府市)
    • 年月日
      2015-03-02 – 2015-03-03
  • [学会発表] Hybrid multichannel signal separation using supervised nonnegative matrix factorization with spectrogram restoration2014

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Satoshi Nakamura, Yu Takahashi, Kazunobu Kondo, Hirokazu Kameoka
    • 学会等名
      Asia Pacific Signal and Information Processing Association Annual Summit and Conference 2014 (APSIPA ASC 2014)
    • 発表場所
      Siem Reap, the city of Angkor Wat, Cambodia
    • 年月日
      2014-12-09 – 2014-12-12
  • [学会発表] Unified approach for underdetermined BSS, VAD, dereverberation and DOA estimation with multichannel factorial HMM2014

    • 著者名/発表者名
      Takuya Higuchi, Hirokazu Kameoka
    • 学会等名
      The 2nd IEEE Global Conference on Signal and Information Processing (GlobalSIP 2014)
    • 発表場所
      Atlanta, Georgia, USA
    • 年月日
      2014-12-03 – 2014-12-05
  • [学会発表] 音声音響信号処理のための確率モデルと学習アルゴリズム2014

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      第17回情報論的学習理論ワークショップ(IBIS2014)
    • 発表場所
      名古屋工業大学 御器所キャンパス(愛知県名古屋市)
    • 年月日
      2014-11-16 – 2014-11-19
    • 招待講演
  • [学会発表] 補助関数法に基づく制約付きボルツマンマシンの学習アルゴリズム2014

    • 著者名/発表者名
      高宗典玄, 亀岡弘和
    • 学会等名
      第17回情報論的学習理論ワークショップ(IBIS2014)
    • 発表場所
      名古屋大学 東山キャンパス(愛知県名古屋市)
    • 年月日
      2014-11-16 – 2014-11-19
  • [学会発表] 多チャンネル階乗隠れマルコフモデルによる音響情景分析のための統合的アプローチ2014

    • 著者名/発表者名
      樋口卓哉, 亀岡弘和
    • 学会等名
      第17回情報論的学習理論ワークショップ(IBIS2014)
    • 発表場所
      名古屋大学 東山キャンパス(愛知県名古屋市)
    • 年月日
      2014-11-16 – 2014-11-19
  • [学会発表] Harmonic-Temporal Factor Decomposition incorporating music prior information for informed monaural source separation2014

    • 著者名/発表者名
      Tomohiko Nakamura, Kotaro Shikata, Norihiro Takamune, Hirokazu Kameoka
    • 学会等名
      The 15th International Society for Music Information Retrieval Conference (ISMIR 2014)
    • 発表場所
      Taipei, Taiwan
    • 年月日
      2014-10-27 – 2014-10-31
  • [学会発表] Training restricted Boltzmann machines with auxiliary function approach2014

    • 著者名/発表者名
      Hirokazu Kameoka, Norihiro Takamune
    • 学会等名
      The 24th IEEE International Workshop on Machine Learning for Signal Processing (MLSP2014)
    • 発表場所
      Reims, France
    • 年月日
      2014-09-21 – 2014-09-24
  • [学会発表] Maximum reconstruction probability training of restricted Boltzmann machines with auxiliary function approach2014

    • 著者名/発表者名
      Norihiro Takamune, Hirokazu Kameoka
    • 学会等名
      The 24th IEEE International Workshop on Machine Learning for Signal Processing (MLSP2014)
    • 発表場所
      Reims, France
    • 年月日
      2014-09-21 – 2014-09-24
  • [学会発表] Joint audio source separation and dereverberation based on multichannel factorial hidden Markov model2014

    • 著者名/発表者名
      Takuya Higuchi, Hirokazu Kameoka
    • 学会等名
      The 24th IEEE International Workshop on Machine Learning for Signal Processing (MLSP2014)
    • 発表場所
      Reims, France
    • 年月日
      2014-09-21 – 2014-09-24
  • [学会発表] Speech prosody generation for text-to-speech synthesis based on generative model of F0 contours2014

    • 著者名/発表者名
      Kento Kadowaki, Tatsuma Ishihara, Nobukatsu Hojo, Hirokazu Kameoka
    • 学会等名
      The 15th Annual Conference of the International Speech Communication Association (Interspeech 2014)
    • 発表場所
      Singapore
    • 年月日
      2014-09-14 – 2014-09-18
  • [学会発表] A unified approach for underdetermined blind signal separation and source activity detection by multichannel factorial hidden Markov models2014

    • 著者名/発表者名
      Takuya Higuchi, Hirofumi Takeda, Tomohiko Nakamura, Hirokazu Kameoka
    • 学会等名
      The 15th Annual Conference of the International Speech Communication Association (Interspeech 2014)
    • 発表場所
      Singapore
    • 年月日
      2014-09-14 – 2014-09-18
  • [学会発表] 補助関数法によるGaussian-Bernoulli RBMの学習アルゴリズム2014

    • 著者名/発表者名
      高宗典玄, 亀岡弘和
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学 豊平キャンパス (北海道札幌市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 多チャンネルFactorial hidden Markov modelによる劣決定ブラインド音源分離と音響イベント検出の統合的アプローチ2014

    • 著者名/発表者名
      樋口卓哉, 竹田裕史, 中村友彦, 亀岡弘和
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学 豊平キャンパス (北海道札幌市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 多チャンネルFactorial hidden Markov modelによる音源分離・残響除去・音響イベント検出の統合的アプローチ2014

    • 著者名/発表者名
      樋口卓哉, 亀岡弘和
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学 豊平キャンパス (北海道札幌市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] Efficient multichannel nonnegative matrix factorization with rank-1 spatial model2014

    • 著者名/発表者名
      北村大地, 小野順貴, 澤田宏, 亀岡弘和, 猿渡洋
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学 豊平キャンパス (北海道札幌市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] 音声F0パターン生成過程の確率モデルによるテキストからの韻律生成及びその評価2014

    • 著者名/発表者名
      門脇健人, 亀岡弘和
    • 学会等名
      日本音響学会2014年秋季研究発表会
    • 発表場所
      北海学園大学 豊平キャンパス (北海道札幌市)
    • 年月日
      2014-09-03 – 2014-09-05
  • [学会発表] Fast signal reconstruction from magnitude spectrogram of continuous wavelet transform based on spectrogram consistency2014

    • 著者名/発表者名
      Tomohiko Nakamura, Hirokazu Kameoka
    • 学会等名
      The 17th International Conference on Digital Audio Effects (DAFx-14)
    • 発表場所
      Erlangen, Germany
    • 年月日
      2014-09-01 – 2014-09-05
  • [学会発表] ケプストラム距離正則化に基づく多重音解析2014

    • 著者名/発表者名
      樋口卓哉, 亀岡弘和
    • 学会等名
      情報処理学会音楽情報科学研究会
    • 発表場所
      京都大学 吉田キャンパス(京都府京都市)
    • 年月日
      2014-08-25 – 2014-08-27
  • [学会発表] 調波時間因子分解法に基づく事前情報付き多重音解析2014

    • 著者名/発表者名
      四方紘太郎, 高宗典玄, 中村友彦, 亀岡弘和
    • 学会等名
      情報処理学会音楽情報科学研究会/電子情報通信学会・日本音響学会音声研究会
    • 発表場所
      日本大学 文理学部キャンパス(東京都世田谷区)
    • 年月日
      2014-05-24 – 2014-05-25
  • [学会発表] "Experimental evaluation of superresolution-based nonnegative matrix factorization for binaural recording2014

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Satoshi Nakamura, Yu Takahashi, Kazunobu Kondo, Hirokazu Kameoka
    • 学会等名
      情報処理学会音楽情報科学研究会/電子情報通信学会・日本音響学会音声研究会
    • 発表場所
      日本大学 文理学部キャンパス(東京都世田谷区)
    • 年月日
      2014-05-24 – 2014-05-25
  • [学会発表] 補助関数法によるGaussian-Bernoulli RBMの学習アルゴリズムの検討2014

    • 著者名/発表者名
      高宗典玄, 亀岡弘和
    • 学会等名
      情報処理学会音楽情報科学研究会/電子情報通信学会・日本音響学会音声研究会
    • 発表場所
      日本大学 文理学部キャンパス(東京都世田谷区)
    • 年月日
      2014-05-24 – 2014-05-25
  • [学会発表] 無矛盾性規準に基づく連続ウェーブレット変換スペクトログラムへの位相推定法と高速化2014

    • 著者名/発表者名
      中村友彦, 亀岡弘和
    • 学会等名
      情報処理学会音楽情報科学研究会/電子情報通信学会・日本音響学会音声研究会
    • 発表場所
      日本大学 文理学部キャンパス(東京都世田谷区)
    • 年月日
      2014-05-24 – 2014-05-25
  • [学会発表] 確率的モデル化に基づく移動音源の劣決定ブラインド音源分離2014

    • 著者名/発表者名
      樋口卓哉, 高宗典玄, 中村友彦, 亀岡弘和
    • 学会等名
      情報処理学会音楽情報科学研究会/電子情報通信学会・日本音響学会音声研究会
    • 発表場所
      日本大学 文理学部キャンパス(東京都世田谷区)
    • 年月日
      2014-05-24 – 2014-05-25
  • [学会発表] 音声F0パターン生成過程の確率モデルによるテキストからの韻律生成2014

    • 著者名/発表者名
      門脇健人, 北条伸克, 石原達馬, 亀岡弘和
    • 学会等名
      情報処理学会音楽情報科学研究会/電子情報通信学会・日本音響学会音声研究会
    • 発表場所
      日本大学 文理学部キャンパス(東京都世田谷区)
    • 年月日
      2014-05-24 – 2014-05-25
  • [学会発表] Divergence optimization in nonnegative matrix factorization with spectrogram restoration for multichannel signal separation2014

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Satoshi Nakamura, Yu Takahashi, Kazunobu Kondo, Hirokazu Kameoka
    • 学会等名
      The 4th Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA 2014)
    • 発表場所
      Nancy, France
    • 年月日
      2014-05-12 – 2014-05-14
  • [学会発表] Underdetermined blind separation and tracking of moving sources based on DOA-HMM2014

    • 著者名/発表者名
      Takuya Higuchi, Norihiro Takamune, Tomohiko Nakamura, Hirokazu Kameoka
    • 学会等名
      2014 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2014)
    • 発表場所
      Florence, Italy
    • 年月日
      2014-05-04 – 2014-05-09
  • [図書] Speech Prosody in Speech Synthesis: Modeling and generation of prosody for high quality and flexible speech synthesis2015

    • 著者名/発表者名
      Hirokazu Kameoka
    • 総ページ数
      213
    • 出版者
      Springer-Verlag Berlin Heidelberg
  • [産業財産権] 信号解析装置、方法、及びプログラム2014

    • 発明者名
      亀岡弘和, 樋口卓哉, 竹田裕史
    • 権利者名
      亀岡弘和, 樋口卓哉, 竹田裕史
    • 産業財産権種類
      特許
    • 産業財産権番号
      特願2014-166903
    • 出願年月日
      2014-08-19

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi