研究課題/領域番号 |
09878065
|
研究種目 |
萌芽的研究
|
配分区分 | 補助金 |
研究分野 |
知能情報学
|
研究機関 | 東京大学 |
研究代表者 |
広瀬 啓吉 東京大学, 大学院・工学系研究科, 教授 (50111472)
|
研究期間 (年度) |
1997 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
1,800千円 (直接経費: 1,800千円)
1998年度: 900千円 (直接経費: 900千円)
1997年度: 900千円 (直接経費: 900千円)
|
キーワード | 隠れマルコフモデル / 頑健な音声認識 / ビタビベイズ予測分類法 / 順次ベイズ学習 / ビタビ探索Minimax法 / 雑音 / 性差 / 事後確率密度関数 / ビタビベイズ予測分類 / 学習 |
研究概要 |
本研究は、隠れマルコフモデル(HMM)に基づく音声認識において、使用環境が学習環境と異なる場合にも認識率の低下が小さな頑健な手法として我々が新しく提案したビタビベイズ予測分類等の確立を図るものである。この手法は、環境の違いにより、音素等のモデルがHMMパラメータ空間において広がりを持つと考えることを基本とするもので、昨年度の引き続き、本年度は下記の成果を得、所期の研究目標を達成した。 1. 使用環境における音声データが与えられた時、順次により確からしい事後確率密度関数を推定してビタビベイズ予測分類を行うことを検討した。事前確率密度関数から事後確率密度関数を推定する過程において、確率密度の分布の項数がべき乗で増大して計算量の爆発を招くという問題があるが、これに対し、N-ベストビタビ経路の選択によって数個の代表的な分布に限定する手法を開発した。60名の話者による離散数字音声を用い、白色雑音付加と性差の場合について実験を行った結果、提案方式の従来方式に対する有効性を、認識性能と学習の収束速度の両面について確認した。 2. 学習環境と使用環境との違いによるHMMモデルの広がりを前提とした認識判定手法として、従来よりMinimax法が提案されているが、連続音声への拡張が困難という問題点があった。これに対し、ビタビ探索をにより擬似Minimax探索を行うことで、反復的に最適経路を探索するアルゴリズムを開発し、連続音声への拡張が可能であることを示した。実際に、白色雑音付加の場合の離散数字音声について有効性を示すとともに、連続数字音声の認識実験でPlag-in MAP等の従来手法に対する大幅な優位性を示した。 3. ビタビベイズ予測分類法、ビタビ探索Minimax法を用いて新聞記事文音声の認識実験を行い、文音声に対する開発方式の基本的有効性を確認した。
|