1991 Fiscal Year Annual Research Report
確率的推論と論理的推論の統合による高次パタ-ン認識・理解方式の研究
Project/Area Number |
02452281
|
Research Institution | Kyoto University |
Principal Investigator |
堂下 修司 京都大学, 工学部, 教授 (00025925)
|
Co-Investigator(Kenkyū-buntansha) |
石橋 勇人 京都大学, 大型計算機センター, 助手 (70212925)
河原 達也 京都大学, 工学部, 助手 (00234104)
北澤 茂良 静岡大学, 工学部, 助教授 (00109018)
山田 篤 京都大学, 工学部, 助手 (20240004)
西田 豊明 京都大学, 工学部, 助教授 (70135531)
|
Keywords | 音声認識 / 音声理解 / 音声対話 / A^*探索 / キ-ワ-ド抽出 / HMM / 確率文脈自由文法 / 意味ネットワ-ク |
Research Abstract |
平成2年度に行なった(1)推論方式、及び(2)音声認識部、(3)言語解析部、(4)概念形成部の各部分の基本的処理方式に関する孝察に基づいて、それらを全体として1つのシステムにまとめるための統合方式を設計し、各部分の結合を行なった。また、各構成部分の見直しを行った。 (1)統合的管理機構・システムの全体的構成: 音声認識・理解システムの3つの構成部分ー音声認識部、言語解析部、概念形成部ーを結合する方式として、leftーtoーright A^*探索とkeywordーdriven解釈の2通りを考え、双方をインプリメントした。A^*探索は、単語対制約をヒュ-リスティックスとし、すべての制約を利用して最尤な単語列を探索するものである。keywordーdriven解釈は、タスク内のキ-ワ-ドを基に、意味仮説を生成・検証していくものである。両者とも、さまざまな論理的な制約を統合的に利用しながら、確率的なスコアを基にして、推論を進めていくものである。 (2)音声認識部: 対判別に基づく連続型HMMという方式を提案し、音素認識率(27子音)で82.8%、単語認識率(語彙数653)で84.8%を得た。また、マルチテンプレ-トを用意し、男女両性の話者に対処できるようにした。 (3)言語解析部: 構文レベルでは、文脈自由文法の確率化を行い、そのA^*探索への適用を提案した。意味レベルでは、意味ネットワ-クによる表現を提案した。これらを用いることにより、語彙数217・静的単語分岐数35のタスクにおいて、不特定話者・連続発声のサンプルに対し、文認識率54.8%、自立語認識率84.2%を得た。 (4)概念解析部: 秘書システムというタスクを設定し、タスク内の主要概念を上記の意味ネットワ-クで記述した。また、ゴ-ル指向の対話の過程をオ-トマトンでモデル化し、システム側からの応答も含めた音声対話システムを構築した。
|
-
[Publications] T.Kawahara and S.Doshita: "Phoneme Recognition by Combining Discriminant Analysis and HMM" Proc.of IEEE Int'l Conf.on Acoustics,Speech,& signal Processing. 1. 557-560 (1991)
-
[Publications] P.Fung,T.Kawahara and S.Doshita: "Unsupervised Speaker Normalization by Speaker Markov Model Converter for SpeakerーIndependent Speech Recognition" Proc.of European Conf.on Speech Communication and Technology. 1111-1115 (1991)
-
[Publications] T.kawahara and S.Doshita: "HMM based on PairーWise Bayes Classifiers" Proc.of IEEE Int'l Conf.on Acoustics,Speech,& Signal Processing. (1992)
-
[Publications] 松本 真治,河原 達也,堂下 修司: "語彙・構文・意味制約を統合したA^*探索による会話音声認識" 電子情報通信学会技術報告. SP91ー93. 17-24 (1991)
-
[Publications] 荒木 雅弘,河原 達也,西田 豊明,堂下 修司: "キ-ワ-ド抽出に基づく意味解析による音声対話システム" 電子情報通信学会技術報告. SP91ー94. 25-32 (1991)
-
[Publications] 河原 達也,荒木 雅弘,堂下 修司: "leftーto right A^*探索とkeywordーdriven解釈の比較" 電子情報通信学会連続音声認識シンポジウム予稿集. 29-32 (1992)