• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

フレーズのスポッティングに基づく頑健な会話音声理解

Research Project

Project/Area Number 08780349
Research Category

Grant-in-Aid for Encouragement of Young Scientists (A)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionKyoto University

Principal Investigator

河原 達也  京都大学, 工学研究科, 助教授 (00234104)

Project Period (FY) 1996
Project Status Completed (Fiscal Year 1996)
Budget Amount *help
¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 1996: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords音声理解 / 言語モデル / フレーズ / スポッティング / A^*探索
Research Abstract

頑健な音声認識を実現するためには、理解に重要な部分を抽出(スポッティング)して、それを基に意味表現を形成していく方式が有望である。従来の単語を単位とするスポッティングでは、マッチングのテンプレートが小さく、また構文的な知識を基本的に利用しないので、局所的な類似性やノイズの影響を受けやすく、結果として誤った単語候補が多数生成された。そこで本研究では、単語ではなく、フレーズのスポッティングに基づくアプローチを研究した。フレーズは、"今日から"や"午後3時に"などのように、単語の組合せ(フレーズ文法)で構成され、意味表現の要素になる単位である。
本アプローチは、(1)単語連鎖、(2)フレーズ構文、(3)フレーズ間制約の順に、徐々に強い制約を適用していく段階的探索戦略に基づいており、各段階の処理は、前段階の結果をヒューリスティックとするA^*探索として実現した。フレーズをスポッティングの単位とすることにより、単語スポッティングに比較してかなり高い抽出率を得た。本スポッティングアルゴリズムは,best-first探索であるので、フレーズ候補を正しくスコア順に得ることができる。さらに、このスポッティングに基づく文認識・理解のためのA^*探索アルゴリズムを、ラティスパージングとトレリスパージングの両方について考案した。最適な探索戦略を実現することで、認識精度を低下させることなく、非定型発話に対する頑健性を実現した。

Report

(1 results)
  • 1996 Annual Research Report
  • Research Products

    (6 results)

All Other

All Publications (6 results)

  • [Publications] 河原達也: "A^*探索に基づいたフレーズスポッティングによる頑健な音声理解" 電子情報通信学会論文誌. J79-DII. 1187-1194 (1996)

    • Related Report
      1996 Annual Research Report
  • [Publications] T.Kawahara: "Comcept-based phrase spotting approach for spontaneous speech understanding" Proc.IEEE Int'1 Conf.Acoust.,Speech & Signal Process. 1. 291-294 (1996)

    • Related Report
      1996 Annual Research Report
  • [Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" Proc.Int'1 Conf.on Spoken Language Processing. 2. 681-684 (1996)

    • Related Report
      1996 Annual Research Report
  • [Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" 電子情報通信学会技術研究報告. SP96-86. (1996)

    • Related Report
      1996 Annual Research Report
  • [Publications] 李晃伸: "A^*探索に基づく大語彙連続音声認識" 情報処理学会研究報告. 96-SLP-11-4. (1996)

    • Related Report
      1996 Annual Research Report
  • [Publications] 三村正人: "パネル討論音声の話者と話題に関する自動インデキシングの検討" 情報処理学会研究報告. 96-SLP-11-3. (1996)

    • Related Report
      1996 Annual Research Report

URL: 

Published: 1996-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi