• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2003 年度 実績報告書

聴覚計算理論の構築とそれに基づく音信号処理の研究

研究課題

研究課題/領域番号 15300061
研究種目

基盤研究(B)

研究機関和歌山大学

研究代表者

入野 俊夫  和歌山大学, システム工学部, 教授 (20346331)

研究分担者 赤木 正人  北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
西浦 敬信  和歌山大学, システム工学部, 助手 (70343275)
河原 英紀  和歌山大学, システム工学部, 教授 (40294300)
鵜木 祐史  北陸先端科学技術大学院大学, 情報科学研究科, 助手 (00343187)
キーワード聴覚計算理論 / wavelet-Mellin変換 / スケール理論 / 聴覚ボコーダ / ガンマチャープ聴覚フィルタ / 音声強調・分離 / STRAIGHT / マイクロホンアレー
研究概要

1)圧縮型ガンマチャープ聴覚フィルタを、多量の聴覚心理物理実験データに対して適合させた。これにより、デファクトスタンダードとなるパラメータを確定させ、対応するソフトも作成した。現在、従来手法との比較を進めている。ソフトは即刻公開可能ではあるが、できれば正確な時間応答特性を決定して導入したいためまだ公開していない。論文1本。国際会議1件。国内発表1件。
2)聴覚のスケール理論を検証する実験を実施した。高品質分析合成系STRAIGHTを用いて母音を様々にスケール変形し、聴覚実験において、どの程度の変形まで同じに聞くことができるかの限界を探った。まず、英語話者・聴取者について、通常人間が発声可能な範囲を大きく超える広い範囲で母音同定ができることを世界ではじめて示した。この結果は、従来の単純な学習や汎化では説明できず、スケール理論を強く支持する。さらに、日本語話者・聴取者について、実環境に近い室内でのスピーカー再生で実験を行い特性を把握した。編集本収録予定1件。国際会議招待講演予定2件。
3)聴覚ボコーダを用いて、背景雑音下の目的音声だけを抽出する方法を提案し、実証した。また、いままでやや複雑だったシステム構成を、ある仮定をおくことにより単純化して学習も不要とし、使い勝手をよくした。これによって分離された音声がさらに良くなり、従来手法よりも聞きやすくなることを確認した。国際会議3件。国内発表1件。
4a)従来Bottom-up的手法が中心だった音声強調処理に音韻特徴仮説をTop-down的に与えることにより,音声強調(波形分離)を行いながら仮説検定を行うシステムを構築し,音声認識に応用した.高雑音下の母音認識において,従来のDTW法ではできなかった認識率を達成した。
4b)自動車内環境に特化した雑音下音声強調処理手法を検討した。手法としては、音声のスペクトル形状を考慮した雑音抑圧フィルタを設計した。自動車内環境において運転者の遠隔発話音声をマイクロホンアレーにて高音質に受音することを試み、従来手法をしのぐ高音質受音ができることを確認した。国際会議1件。国内大会発表1件。

  • 研究成果

    (7件)

すべて その他

すべて 文献書誌 (7件)

  • [文献書誌] Roy D.Patterson Masashi Unoki, Toshio Irino: "Extending the domain of center frequencies for the compressive gammachirp auditory filter"J.Acoust.Soc.Amer.. 114・3. 1529-1542 (2003)

  • [文献書誌] Toshio Irino, Roy D.Patterson, Hideki Kawahara: "Speech segregation using event synchronous auditory vocoder"Proc.IEEE ICASSP 2003. 5. 525-528 (2003)

  • [文献書誌] Toshio Irino, Roy D.Patterson, Hideki Kawahara: "Speech segregation based on fundamental periodicity using auditory vocoder"IEICE Technical Report. 103・155. 55-60 (2003)

  • [文献書誌] Toshio Irino, Roy D.Patterson, Hideki Kawahara: "Speech segregation based on fundamental event information using an auditory vocoder"Proc.ISCA, Eurospeech 2003. 553-556 (2003)

  • [文献書誌] Toshio Irino, Roy D.Patterson: "Analysis of scale information in the auditory system"Proc.ICA 2004(招待講演予定). (未定). (2004)

  • [文献書誌] David R.R.Smith, Roy D.Patterson: "The existence region for scaled vowels in pitch-VTL space"Proc.ICA 2004(招待講演予定). (未定). (2004)

  • [文献書誌] Pressnitzer, D., de Cheveigne A., McAdams, S., Collet, L.Eds.: "Auditory signal processing : physiology, psychoacoustics, and models"Springer Verlag, New York(発刊予定。編集本の1論文)(未定). (2004)

URL: 

公開日: 2005-04-18   更新日: 2014-02-13  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi