• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

研究課題

研究課題/領域番号 23240023
研究機関奈良先端科学技術大学院大学

研究代表者

猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)

研究分担者 戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
小野 順貴  国立情報学研究所, 大学共同利用機関等の部局等, 准教授 (80334259)
宮部 滋樹  筑波大学, システム情報工学研究科(系), 助教 (50598745)
牧野 昭二  筑波大学, システム情報工学研究科(系), 教授 (60396190)
研究期間 (年度) 2011-04-01 – 2015-03-31
キーワード音声情報処理 / 統計的学習理論
研究概要

本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。本年度は、以下の4項目に関して研究を遂行した。(1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎データベースの収録を24年度に引き続き行った。ここでは、主に実環境騒音の収集に注力し、最終的に昨年度完備した20名分の頭部伝達関数と併せ、騒音化での両耳受聴が模擬できるシミュレータ環境を構築した。(2)両耳補聴器システムを確立するため、統計量追跡による非線形信号処理の最適化問題を数理的に議論した。特に、4次統計量不動点に基づく聴覚印象不動処理を独立成分分析アルゴリズムに導入し、実環境模擬データに対する分離評価を行った。特に本年は、ベイズ型音声振幅スペクトル推定における4次統計量不動点を世界で初めて発見し、それを応用したミュージカルノイズフリー音声強調法を開発した。(3)高精度処理に向け、補助関数型ベクトルICAや高次統計量型方向推定の数理を統計量追跡の観点から理論整備し、実環境模擬データベースを用いて評価を行った。(4)発話補助処理システムを確立するため、データベース間における発話のミスマッチを許容する声質変換処理を開発し、その評価を行った。上記の項目を実施することにより、本研究課題の基盤データ整備および基礎アルゴリズムの検討が完了した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

「高次統計量に基づく品質定量化」に関して、申請時計画には無かった「ベイズ推定における高次統計量不動点の発見」と「それを応用したミュージカルノイズフリー処理(品質劣化が一切起きない理論」を世界で初めて理論展開・実証した。特に前者は、通常行われるベイズ推定において不動点が存在しないことを証明し、推定における人工バイアスを加味することによって不動点現象が発芽することを世界で初めて示した。これにより、23年、24年までに開発したスペクトルサブトラクション(これは音声振幅スペクトルの最尤推定に相当)における高次統計量不動点理論と併せ、代表的な複数の統計推定法における高次統計量不動点の理論が整備された。

今後の研究の推進方策

音源分離関連の研究においては、既に計画を先取りしてマルチモーダル化・リアルタイム化に成功していることより、このテストベッドと高次統計量不動点の研究とを融合させ、最終年度に向けたシステム開発を推進する。補聴器応用としては、実際の人間頭部伝達関数の測定が完了したので、それを用いて個人性や環境依存性に関する実験評価を実施する。また、情報変換の例として、音声認識による評価も実施する。声質変換に関しては、現在までに確立した統計的声質変換モデルの精度向上を目指す。

  • 研究成果

    (23件)

すべて 2014 2013 その他

すべて 雑誌論文 (7件) (うち査読あり 7件) 学会発表 (15件) (うち招待講演 6件) 図書 (1件)

  • [雑誌論文] Alaryngeal speech enhancement based on one-to-many eigenvoice conversion2014

    • 著者名/発表者名
      Hironori Doi, Tomoki Toda, Keigo Nakamura, Hiroshi Saruwatari, Kiyohiro Shikano
    • 雑誌名

      IEEE Transactions on Audio, Speech and Language Processing

      巻: 22 ページ: 172-183

    • 査読あり
  • [雑誌論文] Music signal separation based on supervised nonnegative matrix factorization with orthogonality and maximum-divergence penalties2014

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Kosuke Yagi, Kiyohiro Shikano, Yu Takahashi, Kazunobu Kondo
    • 雑誌名

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      巻: E97-A ページ: 1113-1118

    • 査読あり
  • [雑誌論文] Musical-noise-free blind speech extraction integrating microphone array and iterative spectral subtraction2014

    • 著者名/発表者名
      Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard
    • 雑誌名

      Signal Processing (Elsevier)

      巻: 102 ページ: 226-239

    • 査読あり
  • [雑誌論文] Design of multichannel frequency domain statistical-based enhancement systems preserving spatial cues via spectral distances minimization2013

    • 著者名/発表者名
      Frederic Mustiere, Martin Bouchard, Hossein Najaf-Zadeh, Ramin Pichevar, Louis Thibault, Hiroshi Saruwatari
    • 雑誌名

      Signal Processing (Elsevier)

      巻: 93 ページ: 321-325

    • 査読あり
  • [雑誌論文] 日本語の未知語に対する発音付与のための多対多アライメント2013

    • 著者名/発表者名
      久保慶伍, 川波弘道, 猿渡洋, 鹿野清宏
    • 雑誌名

      情報処理学会論文誌

      巻: 54 ページ: 452-462

    • 査読あり
  • [雑誌論文] 音声情報案内システムにおけるBag-of-Wordsを用いた無効入力の棄却2013

    • 著者名/発表者名
      真嶋温佳, 藤田洋子, トーレスラファエル, 川波弘道, 原直, 松井知子, 猿渡洋, 鹿野清宏
    • 雑誌名

      情報処理学会論文誌

      巻: 54 ページ: 443-451

    • 査読あり
  • [雑誌論文] Comparison of methods for topic classification of spoken inquiries2013

    • 著者名/発表者名
      Rafael Torres, Hiromichi Kawanami, Tomoko Matsui, Hiroshi Saruwatari, Kiyohiro Shikano
    • 雑誌名

      IPSJ Journal

      巻: 54 ページ: 157-167

    • 査読あり
  • [学会発表] 高次統計量は何を語る? ~教師無し学習に基づく自律的な音メディア信号処理~2014

    • 著者名/発表者名
      猿渡洋
    • 学会等名
      音学シンポジウム2014
    • 発表場所
      日本大学文理学部百周年記念館, 東京
    • 年月日
      20140524-20140525
    • 招待講演
  • [学会発表] Robust music signal separation based on supervised nonnegative matrix factorization with prevention of basis sharing2013

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Kosuke Yagi, Kiyohiro Shikano, Yu Takahashi, Kazunobu Kondo
    • 学会等名
      IEEE International Symposium on Signal Processing and Information Technology (ISSPIT2013)
    • 発表場所
      Divani Palace Acropolis, Athens, Greece
    • 年月日
      20131212-20131215
  • [学会発表] Theoretical analysis of musical noise generation for blind speech extraction with generalized MMSE short-time spectral amplitude estimator2013

    • 著者名/発表者名
      Shunsuke Nakai, Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura
    • 学会等名
      Intelligent Signal Processing Conference
    • 発表場所
      Strand Palace Hotel, London, UK
    • 年月日
      20131202-20131203
  • [学会発表] Information-geometric optimization in nonlinear noise reduction systems2013

    • 著者名/発表者名
      Hiroshi Saruwatari
    • 学会等名
      2013 International Symposium on Intelligent Signal Processing and Communication Systems (ISPACS2013)
    • 発表場所
      Okinawa Jichi-Kaikan, Naha, Okinawa, Japan
    • 年月日
      20131112-20131115
    • 招待講演
  • [学会発表] Toward musical-noise-free blind speech extraction: concept and its applications2013

    • 著者名/発表者名
      Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard
    • 学会等名
      APSIPA Annual Summit and Conference (APSIPA2013)
    • 発表場所
      The 85 sky tower hotel, Kaohsiung, Taiwan
    • 年月日
      20131029-20131101
    • 招待講演
  • [学会発表] Semi-blind algorithm for joint noise suppression and dereverberation based on higher-order statistics and acoustic model likelihood2013

    • 著者名/発表者名
      Fine Aprilyanti, Hiroshi Saruwatari, Kiyohiro Shikano, Satoshi Nakamura, Tomoya Takatani
    • 学会等名
      APSIPA Annual Summit and Conference (APSIPA2013)
    • 発表場所
      The 85 sky tower hotel, Kaohsiung, Taiwan
    • 年月日
      20131029-20131101
  • [学会発表] The 2013 Signal Separation Evaluation Campaign2013

    • 著者名/発表者名
      Nobutaka Ono, Zbynek Koldovsky, Shigeki Miyabe and Nobutaka Ito
    • 学会等名
      IEEE International Workshop on Machine Learning for Signal Processing 2013
    • 発表場所
      Chilworth Manor Hotel & Conference Centre, Southampton, UK
    • 年月日
      20130922-20130925
  • [学会発表] Blind Source Separation on iPhone in Real Environment2013

    • 著者名/発表者名
      Nobutaka Ono
    • 学会等名
      EUSIPCO2013
    • 発表場所
      Palais des Congres, Marrakech, Morocco
    • 年月日
      20130909-20130913
  • [学会発表] Musical noise analysis for Bayesian minimum mean-square error speech amplitude estimators based on higher-order statistics2013

    • 著者名/発表者名
      Hroshi Saruwatari, Suzumi Kanehara, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo
    • 学会等名
      INTERSPEECH2013
    • 発表場所
      Lyon Convention Centre, Lyon, France
    • 年月日
      20130825-20130829
  • [学会発表] Music signal separation by supervised nonnegative matrix factorization with basis deformation2013

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo, Yu Takahashi
    • 学会等名
      18th International Conference on Digital Signal Processing (DSP2013)
    • 発表場所
      Nomikos Conference Centre, Santorini, Greece
    • 年月日
      20130701-20130703
  • [学会発表] Superresolution-based stereo signal separation via supervised nonnegative matrix factorization2013

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Yusuke Iwao, Kiyohiro Shikano, Kazunobu Kondo, Yu Takahashi
    • 学会等名
      18th International Conference on Digital Signal Processing (DSP2013)
    • 発表場所
      Nomikos Conference Centre, Santorini, Greece
    • 年月日
      20130701-20130703
  • [学会発表] Regularized superresolution-based binaural signal separation with nonnegative matrix factorization2013

    • 著者名/発表者名
      Daichi Kitamura, Hiroshi Saruwatari, Yusuke Iwao, Kiyohiro Shikano, Kazunobu Kondo, Yu Takahashi
    • 学会等名
      2013 International Conference on 3D Systems and Applications (3DSA2013)
    • 発表場所
      Grandfront Osaka, Osaka, Japan
    • 年月日
      20130626-20130628
  • [学会発表] 補助関数型独立ベクトル分析による高速ブラインド音源分離2013

    • 著者名/発表者名
      小野順貴
    • 学会等名
      電子情報通信学会電気音響研究会
    • 発表場所
      岡山大学創立五十周年記念館, 岡山県岡山市
    • 年月日
      20130516-20130517
    • 招待講演
  • [学会発表] 高次統計量追跡に基づくブラインド信号抽出およびその高品質化

    • 著者名/発表者名
      猿渡洋
    • 学会等名
      電子情報通信学会電気音響研究会
    • 発表場所
      機械振興会館, 東京
    • 招待講演
  • [学会発表] これからの応用音響研究のあり方について

    • 著者名/発表者名
      猿渡洋
    • 学会等名
      電子情報通信学会電気音響研究会パネル討論セッション
    • 発表場所
      機械振興会館, 東京
    • 招待講演
  • [図書] Statistical analysis and evaluation of blind speech extraction algorithms (in book chapter)2014

    • 著者名/発表者名
      Hiroshi Saruwatari, Ryoichi Miyazaki
    • 総ページ数
      32
    • 出版者
      Springer

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi