1995 Fiscal Year Annual Research Report
混合仮説検証型並列音素ラベリング(PPL)方式による話者独立音声認識システム
Project/Area Number |
07455157
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
今井 聖 東京工業大学, 精密工学研究所, 教授 (50016763)
|
Keywords | 並列音素ラベリング方式 / 話者独立型システム / 音声認識システム / 音素セグメンテーション / 音素リファレンス / 大語彙化 / 混合仮説検証法 |
Research Abstract |
混合仮説検証型並列音素ラベリング方式に基づく単語音声認識システムによる認識・実験を通して、話者独立システムの認識率向上と大語彙化に対する問題点を明らかにし、その解決を試みた。 (1)これまでに得られている並列音素ラベリング方式による単語音声認識システムで、辞書の単語数を1845語にして、さまざまなタイプの話者独立型のシステムの性能評価を行った。従来のタイプの話者独立型システムのエラーレートは20.7%であったが、本研究で提案のシステムのエラーレートは16.2%であり、PPL方式の有効性が確かめられた。 (2)提案のPPL方式のシステムのエラーレートは、2000語程度で16%程度で一応満足できる性能であったが、エラーレートが必ずしも十分低くないので、エラーの解析を行っている。セグメンテーションとラベリングのエラーが主な原因であることは明らかであるので、それらのシステムの性能改善を試みている。 (3)音素リファレンスセットの構成法として、声質の似た話者の基本セットは混合し、似ていない話者の基本セットは混合しないで並列に使用する形の構成法によるシステムが最も認識率が高いことを確かめた。
|
-
[Publications] Ming-Sheng WANG: "Speech Parsing by Downward Request Search Based on the Divide and Conguer Method" Proc. EUROSPEECH '95. 905-908 (1995)
-
[Publications] Ming-Sheng WANG: "A New Approach of Parsing and Search Based on the Divide and Conquer Strategy for Cont. Speech Recog" IEICE Trans. Inf. & Syst.E78-D. 455-465 (1995)
-
[Publications] Liang ZHOU: "Multisegment Multiple VQ Codebooks-Based Speaker Independent Isolated-Word Recognition" IEICE Trans. Inf. & Syst.E78-D. 1178-1187 (1995)
-
[Publications] 胡力游: "中国語連続音声の声調認識" 電子情報通信学会論文誌. J78-A. 763-768 (1995)
-
[Publications] Toshiko ABE: "Harmonic Estimation Based on Instantaneous Frequency and Its Application to Pitch Determination" IEICE Trans. Inf. & Syst.E78-D. 1188-1194 (1995)
-
[Publications] Keiichi TOKUDA: "Adaptive Cepstral Analysis of Speech" IEEE Tranis Speech and Audio Processing. 3. 481-489 (1995)
-
[Publications] 今井聖: "音声認識" 共立出版, 231 (1995)
-
[Publications] 今井聖: "音声信号処理-聴覚の特性を考慮したケプストラム法" 森北出版, 240 (1996)