• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

時空間音響信号モデリングと機械学習に基づく音響情景分析の研究

研究課題

研究課題/領域番号 26730100
研究機関日本電信電話株式会社NTTコミュニケーション科学基礎研究所

研究代表者

亀岡 弘和  日本電信電話株式会社NTTコミュニケーション科学基礎研究所, メディア情報研究部, 主任研究員 (20466402)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード音響情景分析 / 深層学習 / 多重音解析 / 音響イベント検出 / 音源分離 / 到来方向推定 / 残響除去 / 高速学習アルゴリズム
研究実績の概要

本研究では,音響波動の物理的性質と人間の聴覚機能をヒントにし,計算機による高精度な音環境理解(音響情景分析)機能を実現することを目的としている。2016年度は主に以下の検討を行った。
(1)識別的非負値行列因子分解の基底学習アルゴリズム:非負値行列因子分解(NMF)を用いた教師あり音源分離アプローチでは,音源サンプルの基底スペクトルを事前学習することで,混合信号に含まれる当該音源の成分を分離抽出することが可能となる。従来のこの枠組では基底学習において分離信号そのものが最適となるような規準とはなっていなかったが,分離信号と学習サンプルとの誤差を直接的に最適化規準として基底学習を行う,識別的NMFと呼ぶ枠組が提案されている。識別的NMFの学習規準は従来のNMFの学習規準に比べて解析的に複雑な形になるため,汎用的な最適化手法を用いた基底学習方式が採られていたが,この方式は停留点への収束性が保証されておらず識別的NMFのポテンシャルを十分発揮できていなかった。本研究では,補助関数法という原理に基づく収束性が保証された識別的NMFの基底学習アルゴリズムを提案した。
(2)波源拘束差分方程式に基づく音源定位:小領域・短時間観測により複数の音源の瞬時定位を可能にする理論と基本アルゴリズムを提案し,ベイズ拡張により音源数推定機能と音源追跡機能を新たに実現した。
(3)複素NMFによる高精度音源分離:これまで我々は位相を考慮したNMFの複素領域拡張版である複素NMFと呼ぶ高精度音源分離手法を提案し,その有効性を示してきた。本研究では,複素NMFに「双対形式」が存在することを発見し,この「双対形式」に基づき複素NMFの最適化規準の拡張と時間領域への拡張が可能になり,さらに,多重解像度化など従来のNMFでは不可能だった拡張が可能となった。

  • 研究成果

    (26件)

すべて 2017 2016

すべて 雑誌論文 (1件) (うち査読あり 1件、 謝辞記載あり 1件) 学会発表 (13件) (うち国際学会 9件、 招待講演 5件) 図書 (2件) 産業財産権 (10件)

  • [雑誌論文] Non-negative matrix factorization with basis clustering using cepstral distance regularization2017

    • 著者名/発表者名
      Hirokazu Kameoka, Takuya Higuchi, Mikihiro Tanaka, Li Li
    • 雑誌名

      IEEE/ACM Transactions on Audio, Speech, and Language Processing

      巻: 印刷中 ページ: 印刷中

    • 査読あり / 謝辞記載あり
  • [学会発表] Generative adversarial network-based postfilter for STFT spectrograms2017

    • 著者名/発表者名
      Takuhiro Kaneko, Shinji Takaki, Hirokazu Kameoka, Junichi Yamagishi
    • 学会等名
      18th Annual Conference of International Speech Communication Association (Interspeech 2017)
    • 発表場所
      Stockholm, Sweden
    • 年月日
      2017-08-20 – 2017-08-24
    • 国際学会
  • [学会発表] Sequence-to-sequence voice conversion with similarity metric learned using generative adversarial networks2017

    • 著者名/発表者名
      Takuhiro Kaneko, Hirokazu Kameoka, Kaoru Hiramatsu, Kunio Kashino
    • 学会等名
      18th Annual Conference of International Speech Communication Association (Interspeech 2017)
    • 発表場所
      Stockholm, Sweden
    • 年月日
      2017-08-20 – 2017-08-24
    • 国際学会
  • [学会発表] Physically constrained statistical F0 prediction for electrolaryngeal speech enhancement2017

    • 著者名/発表者名
      Kou Tanaka, Hirokazu Kameoka, Tomoki Toda, Satoshi Nakamura
    • 学会等名
      18th Annual Conference of International Speech Communication Association (Interspeech 2017)
    • 発表場所
      Stockholm, Sweden
    • 年月日
      2017-08-20 – 2017-08-24
    • 国際学会
  • [学会発表] 音響分野におけるブラインド適応信号処理の展開2017

    • 著者名/発表者名
      亀岡弘和, 小野順貴, 猿渡洋
    • 学会等名
      2017年電子情報通信学会総合大会
    • 発表場所
      愛知県名古屋市
    • 年月日
      2017-03-22 – 2017-03-25
    • 招待講演
  • [学会発表] A majorization-minimization algorithm with projected gradient updates for time-domain spectrogram factorization2017

    • 著者名/発表者名
      Hideaki Kagami, Hirokazu Kameoka, Masahiro Yukawa
    • 学会等名
      2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2017)
    • 発表場所
      New Orleans, USA
    • 年月日
      2017-03-05 – 2017-03-09
    • 国際学会
  • [学会発表] Complex NMF with the generalized Kullback-Leibler divergence2017

    • 著者名/発表者名
      Hirokazu Kameoka, Hideaki Kagami, Masahiro Yukawa
    • 学会等名
      2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2017)
    • 発表場所
      New Orleans, USA
    • 年月日
      2017-03-05 – 2017-03-09
    • 国際学会
  • [学会発表] Discriminative non-negative matrix factorization with majorization-minimization2017

    • 著者名/発表者名
      Li Li, Hirokazu Kameoka, Shoji Makino
    • 学会等名
      The 5th Joint Workshop on Hands-free Speech Communi- cation and Microphone Arrays (HSCMA2017)
    • 発表場所
      San Francisco, California, USA
    • 年月日
      2017-03-01 – 2017-03-03
    • 国際学会
  • [学会発表] Complex non-negative matrix factorization: Phase-aware sparse representation of audio spectrograms2016

    • 著者名/発表者名
      Hirokazu Kameoka, Hideaki Kagami
    • 学会等名
      5th Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan
    • 発表場所
      Honolulu, Hawaii, USA
    • 年月日
      2016-11-28 – 2016-12-02
    • 国際学会 / 招待講演
  • [学会発表] Semi-supervised joint enhancement of spectral and cepstral sequences of noisy speech2016

    • 著者名/発表者名
      Li Li, Hirokazu Kameoka, Takuya Higuchi, Hiroshi Saruwatari
    • 学会等名
      The 17th Annual Conference of the International Speech Communication Association (Interspeech 2016)
    • 発表場所
      San Francisco, California, USA
    • 年月日
      2016-09-08 – 2016-09-12
    • 国際学会
  • [学会発表] Reverberation-robust underdetermined source separation with non-negative tensor double deconvolution2016

    • 著者名/発表者名
      Naoki Murata, Hirokazu Kameoka, Keisuke Kinoshita, Shoko Araki, Tomohiro Nakatani, Shoichi Koyama, Hiroshi Saruwatari
    • 学会等名
      2016 24th European Signal Processing Conference (EUSIPCO 2016)
    • 発表場所
      Budapest, Hungary
    • 年月日
      2016-08-29 – 2016-09-02
    • 国際学会
  • [学会発表] 統計的音響信号処理2016

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      NLP若手の会(YANS)第11回シンポジウム
    • 発表場所
      和歌山県西牟婁郡白浜町
    • 年月日
      2016-08-28 – 2016-08-30
    • 招待講演
  • [学会発表] 音響信号の分解と再構成2016

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      第19回画像の認識・理解シンポジウム(MIRU2016)
    • 発表場所
      静岡県浜松市
    • 年月日
      2016-08-01 – 2016-08-04
    • 招待講演
  • [学会発表] 音響信号の分解と再構成2016

    • 著者名/発表者名
      亀岡弘和
    • 学会等名
      情報処理学会音学シンポジウム2016
    • 発表場所
      東京都港区
    • 年月日
      2016-05-21 – 2016-05-22
    • 招待講演
  • [図書] "Gaussian model based multichannel separation" in Audio Source Separation and Speech Enhancement2017

    • 著者名/発表者名
      Alexey Ozerov, Hirokazu Kameoka
    • 総ページ数
      印刷中
    • 出版者
      Springer
  • [図書] "General formulation of multichannel extensions of NMF variants" in Audio Source Separation2017

    • 著者名/発表者名
      Hirokazu Kameoka, Hiroshi Sawada, Takuya Higuchi
    • 総ページ数
      印刷中
    • 出版者
      Springer
  • [産業財産権] 信号推定装置、方法、及びプログラム2017

    • 発明者名
      亀岡弘和, 関翔悟, 戸田智基
    • 権利者名
      亀岡弘和, 関翔悟, 戸田智基
    • 産業財産権種類
      特許特願2017030173
    • 産業財産権番号
      特願2017030173
    • 出願年月日
      2017-02-21
  • [産業財産権] 信号解析装置、方法、及びプログラム2017

    • 発明者名
      亀岡弘和, 李莉
    • 権利者名
      亀岡弘和, 李莉
    • 産業財産権種類
      特許特願2017028843
    • 産業財産権番号
      特願2017028843
    • 出願年月日
      2017-02-20
  • [産業財産権] 音源定位装置、方法、及びプログラム2017

    • 発明者名
      亀岡弘和, 植野夏樹
    • 権利者名
      亀岡弘和, 植野夏樹
    • 産業財産権種類
      特許特願2017037404
    • 産業財産権番号
      特願2017037404
    • 出願年月日
      2017-02-28
  • [産業財産権] 声道スペクトル推定装置、方法、及びプログラム2017

    • 発明者名
      亀岡弘和, ゾウユンハン
    • 権利者名
      亀岡弘和, ゾウユンハン
    • 産業財産権種類
      特許特願2017037402
    • 産業財産権番号
      特願2017037402
    • 出願年月日
      2017-02-28
  • [産業財産権] 基本周波数モデルパラメータ推定装置、方法、及びプログラム2016

    • 発明者名
      亀岡弘和, 平松薫, 柏野邦夫, 佐藤遼太郎
    • 権利者名
      亀岡弘和, 平松薫, 柏野邦夫, 佐藤遼太郎
    • 産業財産権種類
      特許特願2016240303
    • 産業財産権番号
      特願2016240303
    • 出願年月日
      2016-12-12
  • [産業財産権] 基本周波数モデルパラメータ推定装置、方法、及びプログラム2016

    • 発明者名
      亀岡弘和, 平松薫, 柏野邦夫, 佐藤遼太郎
    • 権利者名
      亀岡弘和, 平松薫, 柏野邦夫, 佐藤遼太郎
    • 産業財産権種類
      特許特願2016240304
    • 産業財産権番号
      特願2016240304
    • 出願年月日
      2016-12-12
  • [産業財産権] 信号解析装置、方法、及びプログラム2016

    • 発明者名
      亀岡弘和, 岸田拓也
    • 権利者名
      亀岡弘和, 岸田拓也
    • 産業財産権種類
      特許特願2016168309
    • 産業財産権番号
      特願2016168309
    • 出願年月日
      2016-08-30
  • [産業財産権] 信号解析装置、方法、及びプログラム2016

    • 発明者名
      亀岡弘和, 鏡英章
    • 権利者名
      亀岡弘和, 鏡英章
    • 産業財産権種類
      特許特願2016168322
    • 産業財産権番号
      特願2016168322
    • 出願年月日
      2016-08-30
  • [産業財産権] 信号解析装置、方法、及びプログラム2016

    • 発明者名
      亀岡弘和, 鏡英章
    • 権利者名
      亀岡弘和, 鏡英章
    • 産業財産権種類
      特許特願2016168332
    • 産業財産権番号
      特願2016168332
    • 出願年月日
      2016-08-30
  • [産業財産権] 音声合成学習装置、方法、及びプログラム2016

    • 発明者名
      金子卓弘, 亀岡弘和, 平松薫, 柏野邦夫
    • 権利者名
      金子卓弘, 亀岡弘和, 平松薫, 柏野邦夫
    • 産業財産権種類
      特許特願2016168356
    • 産業財産権番号
      特願2016168356
    • 出願年月日
      2016-08-30

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi