1992 Fiscal Year Annual Research Report
連続音声認識のための音素認識における言語情報の利用に関する研究
Project/Area Number |
03452173
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
城戸 健一 千葉工業大学, 工学部, 教授 (30006209)
|
Co-Investigator(Kenkyū-buntansha) |
荒井 秀一 千葉工業大学, 工学部, 講師 (20212590)
浮貝 雅裕 千葉工業大学, 工学部, 助教授 (80118695)
伊與田 光宏 千葉工業大学, 工学部, 助教授 (90160069)
菅原 研次 千葉工業大学, 工学部, 助教授 (00137853)
三井田 惇郎 千葉工業大学, 工学部, 教授 (10083859)
|
Keywords | 連続音声認識 / 音声認識 / 音素認識 / 不特定話者 |
Research Abstract |
本研究では、音素の誤認傾向を統計的に明らかにし、その特徴を考慮に入れた新しい言語処理方式の開発と音素認識法の開発を行なうが、本年度は以下に示すような研究を行なった。1.平成3年度に開発した、音声データの任意の箇所から任意の区間だけ音声を提示する装置を用いて連続音声から短い音声区間を切り出し、人間の聴覚による音素認識実験を行い、音素区間長並びに音素環境と人間の誤認傾向との関係を明らかにした。実験の結果より、人間の子音認識における誤認識が、音素環境音素の継続長、音素の種類に大きく依存する事が明らかになり、人間の子音認識に関する誤認の傾向を統計的に表現する事が可能になった。2.また、既存の音声データベース(東北大学、電子協などで作成)と平成3年度に作成した音声データベースを用いて、様々な音声分析法により音素認識実験を行い、各音声分析法の、話者及び収録機器の特性、収録環境への依存性を明らかにする事により、上記各条件への依存性が少なく音素認識に適した特徴量の解明を行った。その結果、各音素の誤認の傾向は、特徴量抽出法により異なる事が明らかになったので、その結果と人間の子音誤認識の結果を用いて、人間の誤認識の傾向に本音素認識法の誤認の結果が近くなるように、本音素認識システムに用いる特徴量抽出法を音素毎に決定し、誤認識の傾向が聴覚による認識に近い音素認識システムを確立した。3.さらに、音素認識結果から単語及び文節を抽出する単語・分節スポッティングシステムを本年度設備備品費により購入したワークステーション上に構築し、ネットワークを介して前記音素認識システムと結合した。これにより音声を高速に音素認識し、その結果を用いて単語・文節スポッティングを行なうことが可能になった。
|
Research Products
(6 results)
-
[Publications] 張 中: "ホルマントを用いた中国単語母音の分析と認識" 日本音響学会誌. 47. 281-288 (1991)
-
[Publications] 伊藤 彰則: "機能語予測CYK法による日本語文音声の統語処理" 電子情報通信学会誌. J74-D11,9. 1147-1155 (1991)
-
[Publications] 熊切 義博: "短時間FFTによる音声分析ディスプレイ装置" 日本音響学会春期研究発表会講演論文集. 1-5-17. 431-432 (1992)
-
[Publications] 牧野 正三: "Recognition on phonemes in continuous speech using a modified LVQ2 method" Journal Acoustic Society Japan. Vol.13. 351-360 (1992)
-
[Publications] 荒井 秀一: "A Network for Phenome Recognition by Spectral Local Peaks" Proc.14th International Congress on Acoustics. G-4-1. 877-878 (1992)
-
[Publications] 張 中: "調音結合モデルに基づく中国語音声認識システムの音素認識" 電子情報通信学会誌. J74-D11,9. 1156-1164 (1991)