フレーズのスポッティングに基づく頑健な会話音声理解

Research Project

Project/Area Number	08780349
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent informatics
Research Institution	Kyoto University
Principal Investigator	河原達也京都大学, 工学研究科, 助教授 (00234104)
Project Period (FY)	1996
Project Status	Completed (Fiscal Year 1996)
Budget Amount *help	¥1,000,000 (Direct Cost: ¥1,000,000) Fiscal Year 1996: ¥1,000,000 (Direct Cost: ¥1,000,000)
Keywords	音声理解 / 言語モデル / フレーズ / スポッティング / A^*探索
Research Abstract	頑健な音声認識を実現するためには、理解に重要な部分を抽出(スポッティング)して、それを基に意味表現を形成していく方式が有望である。従来の単語を単位とするスポッティングでは、マッチングのテンプレートが小さく、また構文的な知識を基本的に利用しないので、局所的な類似性やノイズの影響を受けやすく、結果として誤った単語候補が多数生成された。そこで本研究では、単語ではなく、フレーズのスポッティングに基づくアプローチを研究した。フレーズは、"今日から"や"午後3時に"などのように、単語の組合せ(フレーズ文法)で構成され、意味表現の要素になる単位である。本アプローチは、(1)単語連鎖、(2)フレーズ構文、(3)フレーズ間制約の順に、徐々に強い制約を適用していく段階的探索戦略に基づいており、各段階の処理は、前段階の結果をヒューリスティックとするA^探索として実現した。フレーズをスポッティングの単位とすることにより、単語スポッティングに比較してかなり高い抽出率を得た。本スポッティングアルゴリズムは,best-first探索であるので、フレーズ候補を正しくスコア順に得ることができる。さらに、このスポッティングに基づく文認識・理解のためのA^探索アルゴリズムを、ラティスパージングとトレリスパージングの両方について考案した。最適な探索戦略を実現することで、認識精度を低下させることなく、非定型発話に対する頑健性を実現した。

Report

(1 results)

1996 Annual Research Report

Research Products
(6 results)

All Other

All Publications (6 results)

[Publications] 河原達也: "A^*探索に基づいたフレーズスポッティングによる頑健な音声理解" 電子情報通信学会論文誌. J79-DII. 1187-1194 (1996)
- Related Report
  1996 Annual Research Report
[Publications] T.Kawahara: "Comcept-based phrase spotting approach for spontaneous speech understanding" Proc.IEEE Int'1 Conf.Acoust.,Speech & Signal Process. 1. 291-294 (1996)
- Related Report
  1996 Annual Research Report
[Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" Proc.Int'1 Conf.on Spoken Language Processing. 2. 681-684 (1996)
- Related Report
  1996 Annual Research Report
[Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" 電子情報通信学会技術研究報告. SP96-86. (1996)
- Related Report
  1996 Annual Research Report
[Publications] 李晃伸: "A^*探索に基づく大語彙連続音声認識" 情報処理学会研究報告. 96-SLP-11-4. (1996)
- Related Report
  1996 Annual Research Report
[Publications] 三村正人: "パネル討論音声の話者と話題に関する自動インデキシングの検討" 情報処理学会研究報告. 96-SLP-11-3. (1996)
- Related Report
  1996 Annual Research Report

フレーズのスポッティングに基づく頑健な会話音声理解

Principal Investigator

河原 達也 京都大学, 工学研究科, 助教授 (00234104)

¥1,000,000 (Direct Cost: ¥1,000,000)

Report

Research Products

[Publications] 河原達也: "A^*探索に基づいたフレーズスポッティングによる頑健な音声理解" 電子情報通信学会論文誌. J79-DII. 1187-1194 (1996)

Related Report

[Publications] T.Kawahara: "Comcept-based phrase spotting approach for spontaneous speech understanding" Proc.IEEE Int'1 Conf.Acoust.,Speech & Signal Process. 1. 291-294 (1996)

Related Report

[Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" Proc.Int'1 Conf.on Spoken Language Processing. 2. 681-684 (1996)

Related Report

[Publications] T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" 電子情報通信学会技術研究報告. SP96-86. (1996)

Related Report

[Publications] 李晃伸: "A^*探索に基づく大語彙連続音声認識" 情報処理学会研究報告. 96-SLP-11-4. (1996)

Related Report

[Publications] 三村正人: "パネル討論音声の話者と話題に関する自動インデキシングの検討" 情報処理学会研究報告. 96-SLP-11-3. (1996)

Related Report

河原達也京都大学, 工学研究科, 助教授 (00234104)