2001 Fiscal Year Annual Research Report
確率的音声認識における音響確率と言語確率の統合方法
Project/Area Number |
11680386
|
Research Institution | Nagoya University |
Principal Investigator |
武田 一哉 名古屋大学, 工学研究科, 助教授 (20273295)
|
Keywords | 大規模言語コーパス / 形態素解析 / 連続音声認識 / 音響モデル / 言語モデル / エントロピー |
Research Abstract |
統合的言語モデルと,音響モデル双方のモデル化精度の向上に取り組んだ。言語モデルについて,単語クラスに基づく言語モデルを作成し,辞書に出現しない未知の単語へその出現確率を付与する方法を検討した。単語クラス言語モデルを用いて確率を平滑化した後,未知語を単語クラスに割り振り均等な出現確率を与える方法により,未知語を含んだ音声の認識率を最大10%程度向上させることができることを確認した。言語モデルの学習に際しては,形態素解析ツール茶筅の品詞体系に準じた単語クラスを採用することが有効であることも確認した。 一方音響モデルについては帯域不使用HMMの選択に基づくモデル化を検討した。雑音の影響が狭帯域に集中する場合,雑音の影響が強い帯域以外では,音声の情報が残っている。そこで,雑音の音声のスペクトルの情報が失われてしまった周波数帯域以外の帯域のスペクトル情報を用いて認識を行う方法を考案した。実際には観測されたスペクトルのどの帯域に雑音の影響が強いかは未知である。そこで本研究では観測スペクトルをいくつかの帯域に分割し,それぞれの帯域のスペクトル情報が失われていると仮定しそれぞれ対応したモデルで認識し,認識結果から何らかの方法でモデル選択を行うことで高い精度を持つモデル化を行うことができる。
|
-
[Publications] H.Kamiyanagida, H.Saruwatari, K.Takeda, F.Itakura, K.Shikano: "Direcon of Arrival Estimation Using Nonlinear Microphone Array"IEICE TRANS.TUNDAMENTALS. Vol.E84-A,No.4. 999-1010 (2001)
-
[Publications] 河口信夫, 牛窪誠一, 松原茂樹, 岩 博之, 梶田将司, 武田一哉, 板倉文忠: "走行車室内音声対話収録システムの開発"電子情報通信学会論文誌. D-II, Vol.J84-D-II No.6. 909-917 (2001)
-
[Publications] 西野隆典, 梶田将司, 武田一哉, 板倉文忠: "水平方向及び仰角方向に関する頭部伝達関数の補間"日本音響学会誌, Acoustical Science and Technology. 57巻11号. 685-692 (2001)
-
[Publications] Hideki Banno, Kazuya Takeda, Fumitada Itakura: "The effect of group delay spectrum on timbre"Acoustical Science and Technology. 23, 1. 1-9 (2002)
-
[Publications] C.Chandra Sekhar, K.Takeda, F.Ikatura: "Recognition of consonant-vowel utterances using Support Vector Machines"ESANN2001, 9th European Symposium On Artificial Neural Networks. 7-12 (2001)
-
[Publications] O.Segawa, K.Takeda, F.Itakura: "Continuous speech recognition without end-point detection"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.I of VI. 245-248 (2001)
-
[Publications] H.Saruwatari, K.Takeda, F.Itakura, K.Shikano: "Blind source separation combining frequency-domain ICA and beam forming"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.V of VI. 2733-2736 (2001)
-
[Publications] H.Saruwatari, H.Kamiyanagida, K.Takeda, F.Itakura, K.Shikano: "Direction of arrival estimation based on nonlinear microphone array"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.V of VI. 3033-3036 (2001)
-
[Publications] Hideki Banno, Kazuya Takeda, Fumitada Itakura: "A Study on Perceptual Distance Measure for Phase Spectrum of Stimuli"IEEE Signal Processing Society, ICASSP, International Conference on Acoustics, Speech, and Signal Processing. Vol.V of VI. 3297-3300 (2001)
-
[Publications] C.Chandra Sekhar, K.Takeda, F.Itakura: "Close-Class-Set Discrimination Method for Recognition of Stop_Consonant_Vowel Utterances using Support Vector Machines"ICANN2001, International Conference on Artifical Neural Networks. 399-404 (2001)
-
[Publications] Y.Kawamura, K.Takeda, F.Itakura: "Robust speech recognition based on selective use of missing frequency band HMMs"Proc. of 7th European Conference on Speech Communication and technology(Eurospeech'01). vol.2. 1115-1118 (2001)
-
[Publications] N.Kawaguchi, N.Matsubara, K.Takeda, F.Itakura, Y.Inagaki: "Multimedia data collection of in-car speech communication"Proc. of 7th European Conference on Speech Communication and technology(Eurospeech'01). vol.3. 2027-2030 (2001)
-
[Publications] 春日正男, 船田哲男, 林 伸二, 武田一哉: "音声情報処理"コロナ社. (2001)