2003 Fiscal Year Annual Research Report
聴覚シーン形成メカニズムに基づく計算機聴覚についての研究
Project/Area Number |
15650053
|
Research Institution | The University of Aizu |
Principal Investigator |
黄 捷 会津大学, コンピュータ理工学部, 助教授 (10261166)
|
Co-Investigator(Kenkyū-buntansha) |
丁 数学 会津大学, コンピュータ理工学部, 客員研究員
|
Keywords | 聴覚シーン解析 / 聴覚モデル / ストリーミング分離抽出 / 環境ロボスト性 / 聴覚シーン形成要因 |
Research Abstract |
脳型情報処理が近年の人工知能の梗塞状態を打破するための有力な手法として大いに注目を集めているが、脳型情報処理を実現するためには、まず、脳型処理の聴覚、脳型処理の視覚などを実現する必要がある。人間の聴覚における情報処理過程を解明し、聴覚シーンの解析や音声認識などに応用すれば、今までの信号処理技術を飛躍的に向上させることが期待できる。 我々の研究は人間の聴覚シーン形成の過程に注目し、多くの音響イベントが混在する聴覚シーンの中から、いかに特定のストリーミングを分離抽出し、選択的に聞くことができるか、反響やノイズなどの影響をいかに排除するかを解明し、聴覚型処理の計算機システムを目指す。そのために我々は聴覚シーン形成における現象を量的に捕らえ、その相互関係を明らかにすることによって、計算機システムで十分応用できるモデルの構築を目的としている。このような聴覚処理のモデルが構築できれば、複合音の分離抽出はもちろん、今までの音声認識システムとは全く違った聴覚型の音声認識システムが実現できる。この様なシステムは人間の聴覚で見られる高いレベルの環境ロバスト性を備えるので、実際の応用において非常に役に立つと期待できる。 我々は特に、人間の感覚システムは証拠処理システムであるという点に注目する。つまり、ある音響イベントが発生したかどうかの判断は確かな証拠があるか否か、多くの証拠が同じ結果を支持したかどうかで判断することである。証拠として不明確であったり、それぞれの証拠が違う結果を示したりすると、音響イベントの存在も不確定となる。このようなシステムをソフトウエアエージェントにより実現し、音響シーン形成過程を計算机で実現することを目指す。 すでに先行研究では、2つの音響成分の時間のずれ、倍音関係からのずれ、周波数変調の相違、周波数距離などの要因について、音響心理学実験を通じて、量的な関係を明らかにしてきたので、今年の課題は、音声信号について、音の成分間の分離および統合要因がいかに影響するかについて解明を試みた。その結果、2つの異なるピッチの母音がたとえフォルマント成分がまったく同じても、聴覚上は2つの音響事象として捉える傾向があることがわかった。また、いままでの純音ベースの実験は、反響のない状態での聞こえ方を調べたのに対して、反響を加えた時にそれぞれの分離・統合要因がどう影響を受けるかについて調べた。その結果、倍音関係、周波数変調、振幅変調の影響のいずれも減少することがわかった。また、先行音効果について、反響回避モデルを提案し、計算機シミュレーションにより評価を行い、モデルの妥当性を確かめた。
|
Research Products
(6 results)
-
[Publications] J.Huang, Y.Utsuno, S.Ding: "Computational Implementation and Evaluation for the Echo-Avoidance Model of the Precedence Effect"Proc.23^<rd> IASTED Int.Conf.Modelling, Identification, and Control. 506-511 (2004)
-
[Publications] S.Ding, J.Huang: "Recursive approach for real-time blind source separation of acoustic signals"Proc.Knowledge-Based Intelligent Information and Engineering System (Lecture Notes in Artificial Intelligence). 1455-1462 (2003)
-
[Publications] Y.Futamura: "Influence of Echoes and Reverberations on Perceptual Organization of Sound in Human Audition"The University of Aizu, 2003 Graduation Thesis. 1-6 (2004)
-
[Publications] M.Kawauchi: "Perceptual Separation of Overlapped Vowels"The University of Aizu, 2003 Graduation Thesis. 1-5 (2004)
-
[Publications] H.Sato, J.Huang: "Investigating the quantitative factors for sound integration and segregation in human audition"Proc.9^<th> Australian Int.Conf.Speech Science and Technology. (2002)
-
[Publications] K.Yoshida, J.Huang: "Competition between different primary cues for sound component organization in human audition"Proc.5^<th> Int.Conf.Humans and Computers. 7-12 (2002)