1991 Fiscal Year Annual Research Report
連続音声認識のための音素認識における言語情報の利用に関する研究
Project/Area Number |
03452173
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
城戸 健一 千葉工業大学, 工学部, 教授 (30006209)
|
Co-Investigator(Kenkyū-buntansha) |
荒井 秀一 千葉工業大学, 工学部, 講師 (20212590)
浮貝 雅裕 千葉工業大学, 工学部, 助教授 (80118695)
伊與田 光宏 千葉工業大学, 工学部, 助教授 (90160069)
菅原 研次 千葉工業大学, 工学部, 助教授 (00137853)
三井田 惇郎 千葉工業大学, 工学部, 教授 (10083859)
|
Keywords | 音声認識 / 連続音声認識 / 音素認識 / 不特定話者 |
Research Abstract |
本研究では、音素の誤認識の傾向を統計的に明らかにし、その特徴を考慮に入れた新しい言語処理方式の開発と音素認識法の開発を行うが、平成3年度は、本研究全体にわたって必要となる基本的装置の整備、話者及び収録環境への依存性の少ない音素特徴量に関する研究、音素の誤認識の傾向を明らかにするための研究を、以下のように行った。 1.大量のデ-タに基づく信頼性の高い実験を行うために、デ-タ収集・分析・認識実験システムの整備を行った。本年度購入したワ-クステ-ション上にデ-タ収集のための入力機能を構築した。また実験システムの基本ソフトウェアの開発を行いツ-ル化し、今後本研究で開発するソフトウェアが本基本ソフトウェアツ-ル群を利用できるようにした。 2.話者及び収録機器の特性、収録環境への依存性の少ない音素認識に適した特徴量を解明する為には、話者間の差異、話者の個人内分散、収録環境の差異、をそれぞれ表現し得る音声デ-タベ-スが必要となる。 話者間の差異に関しては既存の音声デ-タベ-スで十分なサンプル数が得られたが、話者の個人内分散と収録環境に関しては不十分であったので、新たに各人複数回発声の音声デ-タと、様々な収録環境でのデ-タを収録し、デ-タベ-ス化した。これらのデ-タベ-スを用い、様々な音声分析法による音素認識実験を行った結果、各音声分析法の話者及び収録機器の特性、収録環境への依存性の関係が明らかになった。 3.連続音声から切り出した短い音声区間の聴覚による認識実験を行い、区間長並びに音素環境と誤認識傾向との関係を明らかにするために、任意の音声デ-タの任意の箇所から任意の区間だけ音声をリアルタイムで提示する装置を開発した。現在、本装置を用いて区間長並びに音素環境をパラメタとした提示音を作成しており、本提示音を用いた認識実験により、誤認識傾向との関係を調査しつつある。
|
-
[Publications] 張 中: "ホルマントを用いた中国語単母音の分析と認識" 日本音響学会誌. 47. 281-288 (1991)
-
[Publications] 伊藤 彰則: "機能語予測CYK法による日本語文音声の統語処理" 電子情報通信学会誌. J74ーDII,9. 1147-1155 (1991)
-
[Publications] 張 中: "調音結合モデルを基づく中国語音声認識システムの音素認識" 電子情報通信学会誌. J74ーDII,9. 1156-1164 (1991)
-
[Publications] 古賀 秀昭: "性別判定と多数決を用いたロ-カルピ-クによる単語中母音の認識" 日本音響学会秋季研究発表会講演論文集. 1ー5ー9. 17-18 (1991)
-
[Publications] 棚橋 健二: "短時間FFTによる音声分析ー母音分析による検討ー" 日本音響学会春季研究発表会講演論文集. 2ーQー1. 159-160 (1992)
-
[Publications] 熊切 義博: "短時間FFTによる音声分析ディスプレイ装置" 日本音響学会学季研究発表会講演論文集. 1ー5ー17. 431-432 (1992)