• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

聴覚シーン形成メカニズムに基づく計算機聴覚についての研究

研究課題

研究課題/領域番号 15650053
研究種目

萌芽研究

配分区分補助金
研究分野 生体生命情報学
研究機関会津大学

研究代表者

黄 捷  会津大学, コンピュータ理工学部, 助教授 (10261166)

研究分担者 丁 数学  会津大学, コンピュータ理工学部, 客員研究員
研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
2,200千円 (直接経費: 2,200千円)
2005年度: 700千円 (直接経費: 700千円)
2004年度: 700千円 (直接経費: 700千円)
2003年度: 800千円 (直接経費: 800千円)
キーワードPerceptual organization of sound / Human audition / Auditory scene analysis / Precedence effect / Cocktail party effect / 聴覚シーン解析 / 聴覚シーン形成要因 / 聴覚モデル / 時間周波数分析 / 環境音分析 / ストリーミング分離抽出 / 環境ロボスト性
研究概要

我々の日常環境は多くの音響イベントが混在する。いかに特定のストリーミングを分離抽出し、選択的に聞くことができるか、また反響の影響をいかに排除するか。このような聴覚処理のモデルが構築できれば、高いレベルの環境ロバスト性を備えるので、実際の応用において非常に役に立つと期待できる。これらの問題を解決するために、ボトムアップのアプローチでは2音響成分を用いた心理学実験を通じて、それぞれの要因の総合的な量的関係の解明を試みた。その結果、2成分音脈分凝の時間のずれが調波構造の有無によって約20msから40msに増えることが分かった。また、倍音関係からのずれの度合いも音脈分凝の要因になることが確かめられた。周波数変調相違の影響は5000Hzまでで、調波構造がある場合は約50Hzのずれ、調波構造がない場合は周波数の約10倍のずれで音脈分凝の要因となることが分かった。周波数距離の要因について低周波数成分の約5倍の開きが必要であることも明らかになった。一方、反響を加えた時のそれぞれの分離・統合要因がどう影響を受けるかについても擬似インパルス応答を発生させて反響を加えて心理実験で影響を調べた。その結果、倍音関係、周波数変調、振幅変調の影響のいずれも減少することがわかったが、量的な関係を判断するためにはさらにいろんな状況で調べる必要があるので、今後の研究に期待するところである。また、先行音効果の反響予測を基にした反響回避モデルを提案した。計算機シミュレーションにより評価を行い2クリック音、Hass効果、Franssen効果を矛盾なく説明できたので、音響設計への応用が期待できる。トップダウンのアプローチとしては環境音の特徴をスペクトルとパワーの時間パターンとしてとらえ、多層ニューラルネットワークを用いて認識の試みを行い、45種類の異なる環境音について約90%の認識率が得られた。また、両耳聴現象のカクテルパーティ効果は両耳間の相関関係が重要であるため、独立成分分析の視点から音源分離を試み、実環境でのストリーム分離についても研究を行った。
参考文献は本研究関連の論文をまとめてあげた。

報告書

(3件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (14件)

すべて 2006 2005 2004 2002 その他

すべて 雑誌論文 (8件) 文献書誌 (6件)

  • [雑誌論文] A recursive blind source separation algorithm for real-time processing of acoustic signals2006

    • 著者名/発表者名
      S.Ding, J.Huang, D.Wei, A.Cichocki
    • 雑誌名

      IEEE Trans.Circuits and Systems I 53(1)

      ページ: 114-128

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Influence of echoes and reverberations on perceptual organization of sound in human audition2005

    • 著者名/発表者名
      Y.Futamura, J.Huang, S.Ding, Q.Zhao
    • 雑誌名

      Proc.8^<th> Int.Conf.Humans and Computers

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Blind source separation of acoustic signals in realistic environments based on ICA in the time-frequency domain2005

    • 著者名/発表者名
      S.Ding, A.Cichocki, J.Huang, D.Wei
    • 雑誌名

      Journal of Pervasive Computing and Communications 1(2)

      ページ: 89-99

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Environmental sound recognition by the instantaneous spectrum combined with the time pattern of power2004

    • 著者名/発表者名
      Y.Toyoda, J.Huang, S.Ding, Y.Liu
    • 雑誌名

      Pro.2^<nd> IASTED Int.Conf.Neural Networks and Computational Intelligence

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Computational implementation and evaluation for the echo-avoidance model of the precedence effect2004

    • 著者名/発表者名
      J.Huang, Y.Utsuno, S.Ding
    • 雑誌名

      Pro.23^<rd> IASTED Int.Conf.Modeling, Identification, and Control

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Environmental sound recognition by the instantaneous spectrum combined with the time pattern of power2004

    • 著者名/発表者名
      Y.Toyoda, J.Huang, S.Ding
    • 雑誌名

      Proc. 2^<nd> IASTED Int. Conf. Neural Networks and Computational Intelligence

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Real-time blind source separation of acoustic signals with a recursive approach2004

    • 著者名/発表者名
      S.Ding, J.Huang, D.Wei
    • 雑誌名

      International J. Computational Intelligence and Applications 4・2

      ページ: 193-206

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Investigating the quantitative factors for sound integration and segregation in human audition2002

    • 著者名/発表者名
      H.Sato, J.Huang
    • 雑誌名

      Proc.9^<th> Australian Int.Conf.Speech Science and Technology

    • 関連する報告書
      2005 実績報告書
  • [文献書誌] J.Huang, Y.Utsuno, S.Ding: "Computational Implementation and Evaluation for the Echo-Avoidance Model of the Precedence Effect"Proc.23^<rd> IASTED Int.Conf.Modelling, Identification, and Control. 506-511 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] S.Ding, J.Huang: "Recursive approach for real-time blind source separation of acoustic signals"Proc.Knowledge-Based Intelligent Information and Engineering System (Lecture Notes in Artificial Intelligence). 1455-1462 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Y.Futamura: "Influence of Echoes and Reverberations on Perceptual Organization of Sound in Human Audition"The University of Aizu, 2003 Graduation Thesis. 1-6 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] M.Kawauchi: "Perceptual Separation of Overlapped Vowels"The University of Aizu, 2003 Graduation Thesis. 1-5 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] H.Sato, J.Huang: "Investigating the quantitative factors for sound integration and segregation in human audition"Proc.9^<th> Australian Int.Conf.Speech Science and Technology. (2002)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] K.Yoshida, J.Huang: "Competition between different primary cues for sound component organization in human audition"Proc.5^<th> Int.Conf.Humans and Computers. 7-12 (2002)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi