1992 Fiscal Year Annual Research Report
確率的推論と論理的推論の統合による高次パターン認識・理解方式の研究
Project/Area Number |
02452281
|
Research Institution | KYOTO UNIVERSITY |
Principal Investigator |
堂下 修司 京都大学, 工学部, 教授 (00025925)
|
Co-Investigator(Kenkyū-buntansha) |
石橋 勇人 京都大学, 大型計算機センター, 助手 (70212925)
河原 達也 京都大学, 工学部, 助手 (00234104)
北澤 茂良 静岡大学, 工学部, 助教授 (00109018)
山田 篤 京都大学, 工学部, 助手 (20240004)
西田 豊明 京都大学, 工学部, 助教授 (70135531)
|
Keywords | パターン理解 / 音声認識 / 音声理解 / A^*探索 / キーワード抽出 / HMM / 文脈自由文法 / 意味ネットワーク |
Research Abstract |
前年度までに研究を進めてきた推論方式に基づき、音声認識部、言語解析部、概念形成部の各部分を統合して、音声の認識・理解システムを作成した。本研究では、以下の2種の推論(統合)方式を提案した。 (1)構文主導の推論 語彙・構文レベルにおける確率的推論と論理的推論の統合による文認識を行ない、得られた文候補(単語列)から意味解析を行ない、そこに含まれる概念を抽出する。ここでは、文脈自由文法による予測・限定と音素HMMによる確率による仮説の取捨に基づく時系列状態空間の探索が基本となる。また、構文規則に適用頻度に応じた確率を付与して、より確からしい推論を行なうようにする。left-to-rightに処理が進む。本研究では、最適解が保証されるA^*探索を実現した。 (2)意味主導の推論 入力音声から、まず文の意味を形成する上で重要と考えられるキーワードをHMMにより複数個検出し、それを基に意味解釈の仮説を生成して、意味ネットワークで表現される概念パターン空間上で探索を進めていく。island-driven的な処理である。ただし、キーワード自身の抽出を従来手法のようにその単語の出現確率だけで行なうと、抽出精度が十分でないので、入力が文であることを仮定し、それがキーワードを含む音素列や単語列となるという論理的制約も導入する。 これらの両方式を語彙数236・単語パープレキシティ80のタスクで評価を行なった。文法に沿った定型的な発話に対しては、構文主導の方式が意味理解率65.5%であり、意味主導の方式の44.0%をかなり上回った。しかし、文法を逸脱した発話に対しては、意味主導の方式が頑強であることがわかった。
|
-
[Publications] T.Kawahara and S.Doshita.: "HMM based on pair-wise Bayes classifiers." In Proc.of IEEE-ICASSP. 1. 365-368 (1992)
-
[Publications] T.Kawahara,S.Matsumoto,and S.Doshita.: "A^*-admissible context-free parsing on HMM trellis for speech understanding." In Proc.of Pacific Rim Int′l Conf.on Artificial Intelligence. 2. 1203-1208 (1992)
-
[Publications] M.Araki,T.Kawahara,T.Nishida,and S.Doshita.: "Keyword-driven speech parser using dialog-level knowledge." In Proc.of Pacific Rim Int′l Conf.on Artificial Intelligence. 2. 1025-1029 (1992)
-
[Publications] 河原 達也,堂下 修司.: "対判別に基づく連続型HMMによる音声認識." 電子情報通信学会論文誌. J75DII. 1641-1648 (1992)
-
[Publications] T.Kawahara and S.Doshita.: "Comparison of discrete and continuous classifier-based HMM." Journal of Acoustical Society of Japan (E). 13. 361-367 (1992)
-
[Publications] 宗続 敏彦,河原 達也,荒木 雅弘,堂下 修司.: "自由発話理解のためのキーワードスポッティング法." 電子情報通信学会技術報告. SP92-116 (1993)