2003 Fiscal Year Annual Research Report
Project/Area Number |
15300061
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Research Institution | Wakayama University |
Principal Investigator |
入野 俊夫 和歌山大学, システム工学部, 教授 (20346331)
|
Co-Investigator(Kenkyū-buntansha) |
赤木 正人 北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
西浦 敬信 和歌山大学, システム工学部, 助手 (70343275)
河原 英紀 和歌山大学, システム工学部, 教授 (40294300)
鵜木 祐史 北陸先端科学技術大学院大学, 情報科学研究科, 助手 (00343187)
|
Keywords | 聴覚計算理論 / wavelet-Mellin変換 / スケール理論 / 聴覚ボコーダ / ガンマチャープ聴覚フィルタ / 音声強調・分離 / STRAIGHT / マイクロホンアレー |
Research Abstract |
1)圧縮型ガンマチャープ聴覚フィルタを、多量の聴覚心理物理実験データに対して適合させた。これにより、デファクトスタンダードとなるパラメータを確定させ、対応するソフトも作成した。現在、従来手法との比較を進めている。ソフトは即刻公開可能ではあるが、できれば正確な時間応答特性を決定して導入したいためまだ公開していない。論文1本。国際会議1件。国内発表1件。 2)聴覚のスケール理論を検証する実験を実施した。高品質分析合成系STRAIGHTを用いて母音を様々にスケール変形し、聴覚実験において、どの程度の変形まで同じに聞くことができるかの限界を探った。まず、英語話者・聴取者について、通常人間が発声可能な範囲を大きく超える広い範囲で母音同定ができることを世界ではじめて示した。この結果は、従来の単純な学習や汎化では説明できず、スケール理論を強く支持する。さらに、日本語話者・聴取者について、実環境に近い室内でのスピーカー再生で実験を行い特性を把握した。編集本収録予定1件。国際会議招待講演予定2件。 3)聴覚ボコーダを用いて、背景雑音下の目的音声だけを抽出する方法を提案し、実証した。また、いままでやや複雑だったシステム構成を、ある仮定をおくことにより単純化して学習も不要とし、使い勝手をよくした。これによって分離された音声がさらに良くなり、従来手法よりも聞きやすくなることを確認した。国際会議3件。国内発表1件。 4a)従来Bottom-up的手法が中心だった音声強調処理に音韻特徴仮説をTop-down的に与えることにより,音声強調(波形分離)を行いながら仮説検定を行うシステムを構築し,音声認識に応用した.高雑音下の母音認識において,従来のDTW法ではできなかった認識率を達成した。 4b)自動車内環境に特化した雑音下音声強調処理手法を検討した。手法としては、音声のスペクトル形状を考慮した雑音抑圧フィルタを設計した。自動車内環境において運転者の遠隔発話音声をマイクロホンアレーにて高音質に受音することを試み、従来手法をしのぐ高音質受音ができることを確認した。国際会議1件。国内大会発表1件。
|
Research Products
(7 results)
-
[Publications] Roy D.Patterson Masashi Unoki, Toshio Irino: "Extending the domain of center frequencies for the compressive gammachirp auditory filter"J.Acoust.Soc.Amer.. 114・3. 1529-1542 (2003)
-
[Publications] Toshio Irino, Roy D.Patterson, Hideki Kawahara: "Speech segregation using event synchronous auditory vocoder"Proc.IEEE ICASSP 2003. 5. 525-528 (2003)
-
[Publications] Toshio Irino, Roy D.Patterson, Hideki Kawahara: "Speech segregation based on fundamental periodicity using auditory vocoder"IEICE Technical Report. 103・155. 55-60 (2003)
-
[Publications] Toshio Irino, Roy D.Patterson, Hideki Kawahara: "Speech segregation based on fundamental event information using an auditory vocoder"Proc.ISCA, Eurospeech 2003. 553-556 (2003)
-
[Publications] Toshio Irino, Roy D.Patterson: "Analysis of scale information in the auditory system"Proc.ICA 2004(招待講演予定). (未定). (2004)
-
[Publications] David R.R.Smith, Roy D.Patterson: "The existence region for scaled vowels in pitch-VTL space"Proc.ICA 2004(招待講演予定). (未定). (2004)
-
[Publications] Pressnitzer, D., de Cheveigne A., McAdams, S., Collet, L.Eds.: "Auditory signal processing : physiology, psychoacoustics, and models"Springer Verlag, New York(発刊予定。編集本の1論文)(未定). (2004)