2007 Fiscal Year Annual Research Report
文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発
Project/Area Number |
17700181
|
Research Institution | Shizuoka University |
Principal Investigator |
甲斐 充彦 Shizuoka University, 工学部, 准教授 (60283496)
|
Keywords | 発話検証 / 韻律的特徴 / 音声認識 / 相互情報量 / 音声文書 / 単語関連度 / 発話様式 / 信頼度 |
Research Abstract |
本研究は、発話検証法や発話の曖昧さの要因の定量化法の開発を目的としている。前者においては、自然な対話音声に対する多角的な分析結果をもとに、発話検証性能の改善を試みた。まず、前年度までに開発した韻律的特徴の併用による発話検証法では、発話中に含まれるキーワード数の検証のみに注目したものであったため、新たにキーワード内容を含めた発話検証法へと拡張した。モーラ毎の高低アクセント特徴をHMMでモデル化して韻律信頼度を求め、従来の音響信頼度と併用する方法について評価実験を行った。語彙約1万6千単語のランドマーク入力タスクにおいて、発話中のキーワードスポッティング結果に対する発話検証実験を行った結果、韻律的特徴を併用することで認識結果の単語毎の正誤判定の誤りを約4.3%削減した。もう一つの観点として、文脈を考慮した発話検証法として、音声文書中に含まれるキーワード(名詞単語)の関連度を用いた方法を提案した。相互情報量の観点から単語間の関連度をあらかじめ算出し、一つの音声文書の認識結果において共起するキーワード対に対して、その相互情報量の値を適用した。評価実験では、話し言葉コーパス(CSJ)から10講演を評価用データとして用い、講演音声に含まれる名詞単語に対する検証性能の評価において、単語毎の認識結果の正誤判定の誤りを約5.4%削減した。 後者の発話の曖昧さの要因の定量化法の開発の目的においては、話者や発話様式の違い、未知語の発声などの誤認識の要因について多角的な評価を行った。音響モデル(HMM)の情報のみを用いて、モデル間の距離の定量化方法の違いと音声認識性能との関係を分析した。結果として、発話様式の違いを考慮したモデル間距離を併用して認識性能への影響の違いがより明確に説明できることが分かった。また、単語間距離を考慮することによって未知語検証性能の改善を試み、改善の可能性を示した。
|