• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

高次統計量追跡による自律カスタムメイド音コミュニケーション拡張システムの研究

研究課題

研究課題/領域番号 23240023
研究機関奈良先端科学技術大学院大学

研究代表者

猿渡 洋  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (30324974)

研究分担者 戸田 智基  奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (90403328)
鹿野 清宏  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (00263426)
川波 弘道  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80335489)
小野 順貴  国立情報学研究所, 情報学プリンシプル, 准教授 (80334259)
宮部 滋樹  筑波大学, システム情報工学研究科(系), 助教 (50598745)
牧野 昭二  筑波大学, システム情報工学研究科(系), 教授 (60396190)
研究期間 (年度) 2011-04-01 – 2015-03-31
キーワード音声情報処理 / 統計的学習理論
研究概要

本研究では、新しい統計モデリングおよび高次統計量追跡による能動的声質制御技術の確立、およびその自律カスタムメイド音声コミュニケーション拡張システムへの応用に関して研究を行うことを目的とする。具体的な実証システムとして、高次統計量追跡による高品質ブラインド音源分離に基づく両耳補聴システムや、統計量追跡による声質制御可能な発声補助システムを開発し、その有効性を実証する。 本年度は、以下の4項目に関して研究を遂行した。
(1)実環境における聴覚障害者の音響環境を模擬するため、両耳補聴器に関する基礎データベースの収録を23年度に引き続き行った。最終的に20名分の頭部伝達関数が模擬できるデータベースを構築した。
(2)両耳補聴器の基礎アルゴリズムを確立するため、統計量追跡による非線形信号処理の最適化問題を数理的に議論した。特に、4次統計量不動点に基づく聴覚印象不動処理を独立成分分析アルゴリズムに導入し、実環境模擬データに対する分離評価を行った。また、市販のKinectセンサ上に画像併用型リアルタイム実装し、実環境でのリアルタイム動作の確認を行った。
(3)高精度処理に向け、補助関数型ベクトルICAや高次統計量型方向推定の数理を統計量追跡の観点から理論整備した。
(4)発話補助処理の基礎を確立するため、データベース間における発話のミスマッチを許容する声質変換処理を導出した。また、NAMセンサの高精度化を目指し、6チャネルNAMの統合信号処理を開発した。
上記の項目を実施することにより、本研究課題の基盤データ整備および基礎アルゴリズムの検討が完了した。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

「独立成分分析アルゴリズムのリアルタイム実装」に関して、計画には無かった「画像を含めたマルチモーダルシステム」へ拡張し、評価実験を行った。

今後の研究の推進方策

音源分離関連の研究においては、既に計画を先取りしてマルチモーダル化・リアルタイム化に成功していることより、このテストベッドを有効に活用してアルゴリズム開発を推進する。補聴器応用としては、実際の人間頭部伝達関数の測定が完了したので、それを用いて個人性や環境依存性に関する実験評価を実施する。また、情報変換の例として、音声認識による評価も実施する。声質変換に関しては、現在までに確立した統計的声質変換モデルの精度向上を目指す。

  • 研究成果

    (7件)

すべて 2013 2012 その他

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (5件) (うち招待講演 4件)

  • [雑誌論文] Design of multichannel frequency domain statistical-based enhancement systems preserving spatial cues via spectral distances minimization2013

    • 著者名/発表者名
      Frederic Mustiere
    • 雑誌名

      Signal Processing (Elsevier)

      巻: vol.93 ページ: pp.321-325

    • 査読あり
  • [雑誌論文] Musical-noise-free speech enhancement based on optimized iterative spectral subtraction2012

    • 著者名/発表者名
      Ryoichi Miyazaki
    • 雑誌名

      IEEE Transactions on Audio, Speech and Language Processing

      巻: vol.20 ページ: pp.2080-2094

    • 査読あり
  • [学会発表] Sound-localization-preserved binaural MMSE STSA estimator with explicit and implicit binaural cues

    • 著者名/発表者名
      Hiroshi Saruwatari
    • 学会等名
      Proc. 20th European Signal Processing Conference (EUSIPCO2012)
    • 発表場所
      Bucharest, Romania
    • 招待講演
  • [学会発表] Model training using parallel data with mismatched pause positions in statistical esophageal speech enhancement

    • 著者名/発表者名
      Tomoki Toda
    • 学会等名
      Proc. ICSP2012
    • 発表場所
      Beijing, China
    • 招待講演
  • [学会発表] Auxiliary-function-based Independent Vector Analysis with Power of Vector-norm Type Weighting Functions

    • 著者名/発表者名
      Nobutaka Ono
    • 学会等名
      Proc. APSIPA2012
    • 発表場所
      Hollywood, USA
    • 招待講演
  • [学会発表] New analytical calculation and estimation of TDOA for underdetermined BSS in noisy environments

    • 著者名/発表者名
      Takuro Maruyama
    • 学会等名
      Proc. APSIPA2012
    • 発表場所
      Hollywood, USA
    • 招待講演
  • [学会発表] Underdetermined DOA estimation by the non-linear MUSIC exploiting higher-order moments

    • 著者名/発表者名
      Shigeki Miyabe
    • 学会等名
      Proc. IWAENC2012
    • 発表場所
      Aachen, Germany

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi