2000 Fiscal Year Annual Research Report

確率的音声認識における音響確率と言語確率の統合方法

Research Project

Project/Area Number	11680386
Research Institution	Nagoya University
Principal Investigator	武田一哉名古屋大学, 工学研究科, 助教授 (20273295)
Keywords	大規模言語コーパス / 形態素解析 / 連続音声認識 / 音響モデル / 言語モデル / エントロピー
Research Abstract	統計的言語モデルと、音響モデル双方のモデル化精度の向上に取り組んだ。言語モデルについて、単語クラスに基づく言語モデルを作成し、辞書に出現しない未知の単語へその出現確率を付与する方法を検討した。単語クラス言語モデルを用いて確立を平滑化した後、未知語を単語クラスに割り振り均等な出現確率を与える方法により、未知語を含んだ音声の認識率を最大10%程度向上させることができることを確認した。言語モデルの学習に際しては、形態素解析ツール茶筅の品詞体系に準じた単語クラスを採用することが有効であることも確認した。一方音響モデルについて、は帯域不使用HMMの選択に基づくモデル化を検討した。雑音の影響が狭帯域に集中する場合、雑音の影響が強い帯域以外では、音声の情報が残っている。そこで、雑音で音声のスペクトルの情報が失われてしまった周波数帯域以外の帯域のスペクトル情報を用いて認識を行う手法を考案した。実際には観測されたスペクトルのどの帯域に雑音の影響が強いかは未知である。そこで本研究では観測スペクトルをいくつかの帯域に分割し、それぞれの帯域のスペクトル情報が失われていると仮定しそれぞれ対応したモデルで認識し、認識結果から何らかの方法でモデル選択を行うことで高い精度を持つモデル化を行うことができる。

Research Products
(7 results)

All Other

All Publications (7 results)

[Publications] 寺島志郎,武田一哉,板倉文忠: "SVDを用いたN-gram確率の線形空間表現"電子情報通信学会論文誌. J83-DII No.11. 2388-2396 (2000)
[Publications] 清水泰博,梶田将司,武田一哉,板倉文忠: "空間音響特性を考慮したスペースダイバシチ型音声認識"電子情報通信学会論文誌. J38-DII No.11. 2448-2456 (2000)
[Publications] K.Takeda,M Kondoh,F Itakura: "AN ACOUSTIC MEASURE FOR PREDICTING RECOGNITION RECOGNITON PERFORMANCE DEGRADATION"Proc.of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). III. 1739-1742 (2000)
[Publications] A,Lee,T.Kawahara,K Takeda,K Sikano: "A New Phonetic Tied-Mixture Model for Efficient Decoding"Proc.of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). III. 1747-1750 (2000)
[Publications] Y.Shimizu,S.Kajita,K,Takeda,F Itakura: "Speech Recogniton Based on Space Diversity Using Distributed Multi-Microphone"Proc.of IEEE International Conference of Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). III. 1049-1056 (2000)
[Publications] H.Saruwatari,S.Kajita,K.Takeda,F,Itakura: "Speech Enhancement Using Nonlinear Microphone Array with Noise Adaptive Complementary Beamforming"Proc.of IEEE International Conference of Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). II. 1049-1056 (2000)
[Publications] 鹿野清宏,武田一哉,河原達也,伊藤克亘,山本幹男: "「音声認識システム」"オーム社(情報処理学会ITテキストシリーズ). 196 (2001)

2000 Fiscal Year Annual Research Report

確率的音声認識における音響確率と言語確率の統合方法

Principal Investigator

武田 一哉 名古屋大学, 工学研究科, 助教授 (20273295)

Research Products

[Publications] 寺島志郎,武田一哉,板倉文忠: "SVDを用いたN-gram確率の線形空間表現"電子情報通信学会論文誌. J83-DII No.11. 2388-2396 (2000)

[Publications] 清水泰博,梶田将司,武田一哉,板倉文忠: "空間音響特性を考慮したスペースダイバシチ型音声認識"電子情報通信学会論文誌. J38-DII No.11. 2448-2456 (2000)

[Publications] K.Takeda,M Kondoh,F Itakura: "AN ACOUSTIC MEASURE FOR PREDICTING RECOGNITION RECOGNITON PERFORMANCE DEGRADATION"Proc.of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). III. 1739-1742 (2000)

[Publications] A,Lee,T.Kawahara,K Takeda,K Sikano: "A New Phonetic Tied-Mixture Model for Efficient Decoding"Proc.of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). III. 1747-1750 (2000)

[Publications] Y.Shimizu,S.Kajita,K,Takeda,F Itakura: "Speech Recogniton Based on Space Diversity Using Distributed Multi-Microphone"Proc.of IEEE International Conference of Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). III. 1049-1056 (2000)

[Publications] H.Saruwatari,S.Kajita,K.Takeda,F,Itakura: "Speech Enhancement Using Nonlinear Microphone Array with Noise Adaptive Complementary Beamforming"Proc.of IEEE International Conference of Acoustics, Speech, and Signal Processing (ICASSP'99,June,2000,Istanbul). II. 1049-1056 (2000)

[Publications] 鹿野清宏,武田一哉,河原達也,伊藤克亘,山本幹男: "「音声認識システム」"オーム社(情報処理学会ITテキストシリーズ). 196 (2001)

武田一哉名古屋大学, 工学研究科, 助教授 (20273295)