研究課題/領域番号 |
03452173
|
研究機関 | 千葉工業大学 |
研究代表者 |
城戸 健一 千葉工業大学, 工学部, 教授 (30006209)
|
研究分担者 |
荒井 秀一 千葉工業大学, 工学部, 講師 (20212590)
浮貝 雅裕 千葉工業大学, 工学部, 助教授 (80118695)
伊與田 光宏 千葉工業大学, 工学部, 助教授 (90160069)
菅原 研次 千葉工業大学, 工学部, 助教授 (00137853)
三井田 惇郎 千葉工業大学, 工学部, 教授 (10083859)
|
キーワード | 音声認識 / 連続音声認識 / 音素認識 / 不特定話者 |
研究概要 |
本研究では、音素の誤認識の傾向を統計的に明らかにし、その特徴を考慮に入れた新しい言語処理方式の開発と音素認識法の開発を行うが、平成3年度は、本研究全体にわたって必要となる基本的装置の整備、話者及び収録環境への依存性の少ない音素特徴量に関する研究、音素の誤認識の傾向を明らかにするための研究を、以下のように行った。 1.大量のデ-タに基づく信頼性の高い実験を行うために、デ-タ収集・分析・認識実験システムの整備を行った。本年度購入したワ-クステ-ション上にデ-タ収集のための入力機能を構築した。また実験システムの基本ソフトウェアの開発を行いツ-ル化し、今後本研究で開発するソフトウェアが本基本ソフトウェアツ-ル群を利用できるようにした。 2.話者及び収録機器の特性、収録環境への依存性の少ない音素認識に適した特徴量を解明する為には、話者間の差異、話者の個人内分散、収録環境の差異、をそれぞれ表現し得る音声デ-タベ-スが必要となる。 話者間の差異に関しては既存の音声デ-タベ-スで十分なサンプル数が得られたが、話者の個人内分散と収録環境に関しては不十分であったので、新たに各人複数回発声の音声デ-タと、様々な収録環境でのデ-タを収録し、デ-タベ-ス化した。これらのデ-タベ-スを用い、様々な音声分析法による音素認識実験を行った結果、各音声分析法の話者及び収録機器の特性、収録環境への依存性の関係が明らかになった。 3.連続音声から切り出した短い音声区間の聴覚による認識実験を行い、区間長並びに音素環境と誤認識傾向との関係を明らかにするために、任意の音声デ-タの任意の箇所から任意の区間だけ音声をリアルタイムで提示する装置を開発した。現在、本装置を用いて区間長並びに音素環境をパラメタとした提示音を作成しており、本提示音を用いた認識実験により、誤認識傾向との関係を調査しつつある。
|