• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

聴覚計算理論の構築とそれに基づく音信号処理の研究

研究課題

研究課題/領域番号 15300061
研究機関和歌山大学

研究代表者

入野 俊夫  和歌山大学, システム工学部, 教授 (20346331)

研究分担者 河原 英紀  和歌山大学, システム工学部, 教授 (40294300)
坂野 秀樹  和歌山大学, システム工学部, 助手 (20335003)
西浦 敬信  立命館大学, 情報理工学部, 助教授 (70343275)
赤木 正人  北陸先端科学技術大学院大学, 情報科学研究科, 教授 (20242571)
鵜木 祐史  北陸先端科学技術大学院大学, 情報科学研究科, 助手 (00343187)
キーワード聴覚計算理論 / wavelet-Mellin変換 / スケール理論 / 聴覚ボコーダ / ガンマチャープ聴覚フィルタ / 音声強調・分離 / STRAIGHT / マイクロホンアレー
研究概要

1)一貫して開発してきた圧縮型ガンマチャープ聴覚フィルタに関して、時間的な応答も導入した動的なフィルタバンクを構築した。これにより、内耳の重要な特性として知られている二音抑圧や前方向性マスキングをきわめて少ないパラメータで定性的に説明できることを示した。しかも、昨年度の同時マスキングの定量的説明時のパラメータセットを基本としていて、近似度がきわめて高くなった。単にそればかりでなく、分析した結果から逆に音を再合成できる世界で唯一のフィルタバンクである。この利点を生かし、今後信号処理に活用する。現在論文投稿中で、掲載次第、公開を検討する。論文投稿中1件。国際会議予定1件。編集本収録予定1件。
2)聴覚のスケール理論を検証する実験結果の論文を書き、聴知覚関連でもっとも影響力のある米国音響学会誌に掲載された。この論文と国内外4件の招待講演は、新しい研究フィールドが出現したことを広く知らせるもので重要である。さらに、これらの結果を受け、米国音響学会大会においてスペシャルセッションを2005年5月に開催企画している。論文1件。編集本収録予定1件。招待講演:国際2件、国内2件、国際予定3件。
3)聴覚ボコーダによる背景雑音下の目的音声抽出手法に関して、当初の目標レベルは達成したので、論文化等まとめの作業を行った。また、このシステムの基本となる、耐雑音性が世界トップレベルの基本周波数抽出法についての論文も掲載された。論文1件。編集本収録1件。論文投稿中1件。
4a)音韻特徴仮説をTop-down的に与えてBottom-up処理も交えて仮説検定を行う基本システムを、無声音に対しても適用可能とするように拡張した。高雑音下の母音認識において、従来のDTW法ではできなかった認識率を達成できることを確認した。国際会議1件、国内大会・研究会発表2件。
4b)昨年度提案した雑音下音声強調手法の前処理として、今年度は空間内の発話者の位置を推定する手法を検討した。信号帯域別に分割し、それに重付けをして加えることにより、従来手法よりも高精度に位置が推定できることを確認した。国際会議3件、国内大会発表2件。

  • 研究成果

    (7件)

すべて 2005 2004

すべて 雑誌論文 (6件) 図書 (1件)

  • [雑誌論文] The processing and perception of size information in speech sounds2005

    • 著者名/発表者名
      Smith, D.R., Patterson, R.D., Turner, R., Kawahara, H., Irino, T.
    • 雑誌名

      J.Acoust.Soc.Amer. 117・1

      ページ: 305-318

  • [雑誌論文] A study on a speech recognition method based on the selective sound segregation in noisy environment2005

    • 著者名/発表者名
      Haniu, A., Unoki, M., Akagi, M.
    • 雑誌名

      Proc.RISP Int. Workshop on Nonlinear Circuits and Signal Processing (NCSP2005) (未定)

  • [雑誌論文] Robust and accurate fundamental frequency estimation based on dominant harmonic components2004

    • 著者名/発表者名
      Tomohiro Nakatani, Toshio Irino
    • 雑誌名

      J.Acoust.Soc.Amer. 116・1

      ページ: 3690-3700

  • [雑誌論文] Analysis of scale information in the auditory system2004

    • 著者名/発表者名
      Toshio Irino, Roy D.Patterson
    • 雑誌名

      Proc.18th International Congress on Acoustics(招待講演) 1

      ページ: 457-460

  • [雑誌論文] Speech segregation using an auditory vocoder with event-synchronous enhancements2004

    • 著者名/発表者名
      Toshio Irino, Roy D.Patterson, Hideki Kawahara
    • 雑誌名

      Proc.18th International Congress on Acoustics 4

      ページ: 3025-3028

  • [雑誌論文] A Design of Audio-Visual Talker Tracking System Based On CSP Analysis and Frame Difference in Real Noisy Environments2004

    • 著者名/発表者名
      Yuki Denda, Takanobu Nishiura, Hideki Kawahara, Toshio Irino
    • 雑誌名

      Proc.2004 IEEE International workshop on multimedia signal processing 1

      ページ: 63-66

  • [図書] Speech Separation by Human and Machines(編集本の2論文)2004

    • 著者名/発表者名
      Pierre Divenyi (Ed.)
    • 総ページ数
      319
    • 出版者
      Kluwer Academic Publishers, Dordrechet (The Netherlands)

URL: 

公開日: 2006-07-12   更新日: 2014-02-13  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi