• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文脈を含む多角的な発話検証を可能にする対話音声理解システムの開発

Research Project

Project/Area Number 17700181
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Perception information processing/Intelligent robotics
Research InstitutionShizuoka University

Principal Investigator

甲斐 充彦  Shizuoka University, 工学部, 准教授 (60283496)

Project Period (FY) 2005 – 2007
Project Status Completed (Fiscal Year 2007)
Budget Amount *help
¥3,000,000 (Direct Cost: ¥3,000,000)
Fiscal Year 2007: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2006: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2005: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywords発話検証 / 韻律的特徴 / 音声認識 / 相互情報量 / 音声文書 / 単語関連度 / 発話様式 / 信頼度 / 発話検証法 / 音声認識性能 / 韻律特徴 / 単語アクセント / 話し言葉 / 統計モデル / 音声理解 / 統計的モデル / キーワードスポッティング / 大語彙音声認識 / 誤り要因 / HMM
Research Abstract

本研究は、発話検証法や発話の曖昧さの要因の定量化法の開発を目的としている。前者においては、自然な対話音声に対する多角的な分析結果をもとに、発話検証性能の改善を試みた。まず、前年度までに開発した韻律的特徴の併用による発話検証法では、発話中に含まれるキーワード数の検証のみに注目したものであったため、新たにキーワード内容を含めた発話検証法へと拡張した。モーラ毎の高低アクセント特徴をHMMでモデル化して韻律信頼度を求め、従来の音響信頼度と併用する方法について評価実験を行った。語彙約1万6千単語のランドマーク入力タスクにおいて、発話中のキーワードスポッティング結果に対する発話検証実験を行った結果、韻律的特徴を併用することで認識結果の単語毎の正誤判定の誤りを約4.3%削減した。もう一つの観点として、文脈を考慮した発話検証法として、音声文書中に含まれるキーワード(名詞単語)の関連度を用いた方法を提案した。相互情報量の観点から単語間の関連度をあらかじめ算出し、一つの音声文書の認識結果において共起するキーワード対に対して、その相互情報量の値を適用した。評価実験では、話し言葉コーパス(CSJ)から10講演を評価用データとして用い、講演音声に含まれる名詞単語に対する検証性能の評価において、単語毎の認識結果の正誤判定の誤りを約5.4%削減した。
後者の発話の曖昧さの要因の定量化法の開発の目的においては、話者や発話様式の違い、未知語の発声などの誤認識の要因について多角的な評価を行った。音響モデル(HMM)の情報のみを用いて、モデル間の距離の定量化方法の違いと音声認識性能との関係を分析した。結果として、発話様式の違いを考慮したモデル間距離を併用して認識性能への影響の違いがより明確に説明できることが分かった。また、単語間距離を考慮することによって未知語検証性能の改善を試み、改善の可能性を示した。

Report

(3 results)
  • 2007 Annual Research Report
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • Research Products

    (3 results)

All 2007 2006

All Journal Article (3 results) (of which Peer Reviewed: 1 results)

  • [Journal Article] Spoken Language Understanding Method Using Confidence Measure and Dialogue History2007

    • Author(s)
      N.Fujiwara, T.Itoh, K.Araki, A.Kai, T.Konishi and Y.Itoh
    • Journal Title

      Systems and Computers in Japan 38

      Pages: 21-31

    • NAID

      110007380488

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] キーワード主体の頑健な音声インタフェースのための韻律的特徴を用いた発話検証2006

    • Author(s)
      甲斐充彦, 板倉雅和
    • Journal Title

      情報処理学会研究報告 SLP61・3

      Pages: 13-18

    • NAID

      110004849717

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 認識信頼度と対話履歴を用いた音声言語理解手法2006

    • Author(s)
      藤原, 伊藤, 荒木, 甲斐, 小西, 伊東
    • Journal Title

      電子情報通信学会論文誌 (D) J89-D・7

      Pages: 1493-1503

    • NAID

      110007380488

    • Related Report
      2006 Annual Research Report

URL: 

Published: 2005-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi