2007 Fiscal Year Annual Research Report
ウェブドキュメントを利用した音声認識結果の信頼度推定と音声認識の高精度化
Project/Area Number |
19700184
|
Research Institution | Fukuoka University |
Principal Investigator |
高橋 伸弥 Fukuoka University, 工学部, 助教 (40330899)
|
Keywords | 音声認識 / 言語モデル / スペクトラルクラスタリング / ニュース音声 / 音声認識信頼度 / 字幕テキスト自動対応付け / Confusion Matrix / ウェブドキュメント |
Research Abstract |
ニュース音声に対する高精度な自動索引付けを目的として、その内容に類似したウェブドキュメントを自動的に収集し、ニュース音声専用の言語モデルを構築する手法について検討した。ウェブドキュメントを収集するための検索キーワードには、ニュース音声に対する音声認識結果中の名詞句を用いることとし、スペクトラルクラスタリングと呼ばれるクラスタリング手法を用いて誤認識された語句から収集された文書と正認識された語句から収集された文書とを分類することにより、音声認識用言語モデルの精度を向上させることを試みた。小規模なデータに対する実験を行い、本提案手法の基本的なアイデアの有効性を確認し、それらを国際会議他で発表した。 更に、複数のトピックから構成されるニュース音声に対する、同様のアプローチに基づいたトピック切り分け手法を考案し、クラスタリングによりトピック境界を検出することを試みた。具体的には、複数のトピックから得られた誤りを含む検索キーワードを用いてウェブドキュメントを収集し、それらをクラスタリングすることで同一のトピックに関するドキュメントとそれ以外とに分類することでトピック境界を検出しようというものである。小規模なデータに対する実験により、その有効性を確認し改善点を検討し、結果を発表した。 また、上記の提案手法の前処理としての音声区間切り出しおよび音声・非音声識別の高精度化を検討するため、音素認識における混同行列を利用した字幕テキストの自動対応付けを試み、その有効性について検討したものを国内外の学会で発表した。
|
Research Products
(4 results)