2005 年度実績報告書

聴覚シーン形成メカニズムに基づく計算機聴覚についての研究

研究課題

研究課題/領域番号	15650053
研究機関	会津大学
研究代表者	黄捷会津大学, コンピュータ理工学部, 助教授 (10261166)
キーワード	Perceptual organization of sound / Human audition / Auditory scene analysis / Precedence effect / Cocktail party effect
研究概要	我々の日常環境は多くの音響イベントが混在する。いかに特定のストリーミングを分離抽出し、選択的に聞くことができるか、また反響の影響をいかに排除するか。このような聴覚処理のモデルが構築できれば、高いレベルの環境ロバスト性を備えるので、実際の応用において非常に役に立つと期待できる。これらの問題を解決するために、ボトムアップのアプローチでは2音響成分を用いた心理学実験を通じて、それぞれの要因の総合的な量的関係の解明を試みた。その結果、2成分音脈分凝の時間のずれが調波構造の有無によって約20msから40msに増えることが分かった。また、倍音関係からのずれの度合いも音脈分凝の要因になることが確かめられた。周波数変調相違の影響は5000Hzまでで、調波構造がある場合は約50Hzのずれ、調波構造がない場合は周波数の約10倍のずれで音脈分凝の要因となることが分かった。周波数距離の要因について低周波数成分の約5倍の開きが必要であることも明らかになった。一方、反響を加えた時のそれぞれの分離・統合要因がどう影響を受けるかについても擬似インパルス応答を発生させて反響を加えて心理実験で影響を調べた。その結果、倍音関係、周波数変調、振幅変調の影響のいずれも減少することがわかったが、量的な関係を判断するためにはさらにいろんな状況で調べる必要があるので、今後の研究に期待するところである。また、先行音効果の反響予測を基にした反響回避モデルを提案した。計算機シミュレーションにより評価を行い2クリック音、Hass効果、Franssen効果を矛盾なく説明できたので、音響設計への応用が期待できる。トップダウンのアプローチとしては環境音の特徴をスペクトルとパワーの時間パターンとしてとらえ、多層ニューラルネットワークを用いて認識の試みを行い、45種類の異なる環境音について約90%の認識率が得られた。また、両耳聴現象のカクテルパーティ効果は両耳間の相関関係が重要であるため、独立成分分析の視点から音源分離を試み、実環境でのストリーム分離についても研究を行った。参考文献は本研究関連の論文をまとめてあげた。

研究成果
(6件)

すべて 2006 2005 2004 2002

すべて雑誌論文 (6件)

[雑誌論文] A recursive blind source separation algorithm for real-time processing of acoustic signals2006
- 著者名/発表者名
  S.Ding, J.Huang, D.Wei, A.Cichocki
- 雑誌名
  
  IEEE Trans.Circuits and Systems I 53(1)
  
  ページ: 114-128
[雑誌論文] Influence of echoes and reverberations on perceptual organization of sound in human audition2005
- 著者名/発表者名
  Y.Futamura, J.Huang, S.Ding, Q.Zhao
- 雑誌名
  
  Proc.8^<th> Int.Conf.Humans and Computers
[雑誌論文] Blind source separation of acoustic signals in realistic environments based on ICA in the time-frequency domain2005
- 著者名/発表者名
  S.Ding, A.Cichocki, J.Huang, D.Wei
- 雑誌名
  
  Journal of Pervasive Computing and Communications 1(2)
  
  ページ: 89-99
[雑誌論文] Environmental sound recognition by the instantaneous spectrum combined with the time pattern of power2004
- 著者名/発表者名
  Y.Toyoda, J.Huang, S.Ding, Y.Liu
- 雑誌名
  
  Pro.2^<nd> IASTED Int.Conf.Neural Networks and Computational Intelligence
[雑誌論文] Computational implementation and evaluation for the echo-avoidance model of the precedence effect2004
- 著者名/発表者名
  J.Huang, Y.Utsuno, S.Ding
- 雑誌名
  
  Pro.23^<rd> IASTED Int.Conf.Modeling, Identification, and Control
[雑誌論文] Investigating the quantitative factors for sound integration and segregation in human audition2002
- 著者名/発表者名
  H.Sato, J.Huang
- 雑誌名
  
  Proc.9^<th> Australian Int.Conf.Speech Science and Technology

2005 年度 実績報告書

聴覚シーン形成メカニズムに基づく計算機聴覚についての研究

研究代表者

黄 捷 会津大学, コンピュータ理工学部, 助教授 (10261166)

研究成果

[雑誌論文] A recursive blind source separation algorithm for real-time processing of acoustic signals2006

著者名/発表者名

雑誌名

[雑誌論文] Influence of echoes and reverberations on perceptual organization of sound in human audition2005

著者名/発表者名

雑誌名

[雑誌論文] Blind source separation of acoustic signals in realistic environments based on ICA in the time-frequency domain2005

著者名/発表者名

雑誌名

[雑誌論文] Environmental sound recognition by the instantaneous spectrum combined with the time pattern of power2004

著者名/発表者名

雑誌名

[雑誌論文] Computational implementation and evaluation for the echo-avoidance model of the precedence effect2004

著者名/発表者名

雑誌名

[雑誌論文] Investigating the quantitative factors for sound integration and segregation in human audition2002

著者名/発表者名

雑誌名

2005 年度実績報告書

黄捷会津大学, コンピュータ理工学部, 助教授 (10261166)