2006 Fiscal Year Annual Research Report
ドメイン独立な話し言葉のモデル化に基づく音声認識の研究
Project/Area Number |
18700177
|
Research Institution | Kyoto University |
Principal Investigator |
秋田 祐哉 京都大学, 学術情報メディアセンター, 助手 (90402742)
|
Keywords | 音声認識 / 言語モデル / 発音モデル / 話し言葉 / ドメイン |
Research Abstract |
平成18年度では,ドメインへの独立性にはこだわらず,おもに話し言葉の特徴の明確化と統計的分析に基づく話し言葉変換の枠組みの検討,および音声認識によるこれらの評価を課題とした. 1.ドメインごとの話し言葉の特徴のモデル化 国会討論のドメインにおいて,話し言葉とその整形テキストを対応付けたデータベースをもとに統計的分析を行い,話し言葉に特徴的な表現とその発生条件(文脈)・頻度・比率など,提案する変換が有効に機能することが期待できるデータが得られた.これをもとに,音声認識用言語モデルを変換するための話し言葉変換モデルについて,バックオフ的手法や最大エントロピー法などの複数の統計的枠組みの検討を行った. 2.話し言葉変換モデルを用いた音声認識 1.による話し言葉変換モデルについて,同一ドメインでの音声認識に対する有効性を検証した.変換モデルの構築に用いた学習データと同じドメインである国会音声の認識を行い,学習データが少量であったにもかかわらず,言語的な予測能力の向上と実際の音声認識精度の向上を得た.特にバックオフ的手法が頑健に機能することが明らかとなった,また,従来の言語モデル構築法ではこのような少量データでは十分に対処することができない,話題の異なる(国会会議)音声においても言語的予測能力が大きく改善された.以上より提案法の有効性が示されたといえる. これらの成果について,国内の全国大会のほか,国際会議にて発表を行った.
|