研究課題/領域番号 |
02452281
|
研究種目 |
一般研究(B)
|
配分区分 | 補助金 |
研究分野 |
情報学
|
研究機関 | 京都大学 |
研究代表者 |
堂下 修司 京都大学, 工学部, 教授 (00025925)
|
研究分担者 |
石橋 勇人 京都大学, 大型計算機センター, 助手 (70212925)
河原 達也 京都大学, 工学部, 助手 (00234104)
北澤 茂良 静岡大学, 工学部, 助教授 (00109018)
山田 篤 京都大学, 工学部, 助手 (20240004)
西田 豊明 京都大学, 工学部, 助教授 (70135531)
|
研究期間 (年度) |
1990 – 1992
|
キーワード | パターン理解 / 音声認識 / 音声理解 / HMM / 文脈自由文法 / キーワード抽出 / 意味ネットワーク / A^*探索 |
研究概要 |
高次パターン認識・理解系をめざして、さまざまな知識レベルにおける推論方式を検討し、それらを統合した音声認識・理解システムを構築した。 (1)音素認識部 音声認識・理解系の基盤となる音素認識部の高精度化を図り、対判別に基づく音素HMMを提案した。多数話者の音素認識率(27子音)で83.1%、単語認識率(語彙数653)で84.8%を得た。 (2)構文解析部 語彙・構文レベルにおける確率的推論と論理的推論の統合による文認識を行なった。ここでは、構文規則による予測・限定とHMMの確率による仮説の取捨に基づく探索が基本となる。文脈自由(LR)パージングにおいて、単語対制約によるヒューリスティックを用いたA^*探索アルゴリズムを実現した。 (3)キーワード抽出部 構文規則を用いなくても、複数のキーワードを抽出することにより、文の意味が理解できると考えられる。しかし、キーワードの抽出を従来のようにその単語の出現確率だけで行なうと精度が十分でないので、入力が文であることを仮定し、それがキーワードを含む音素列や単語列になるという論理的制約も導入した。 (4)意味解析部 (2)の処理で得られる文候補(N-bestの単語列)、ならびに(3)の処理で得られる単語ラティスに対して、意味表現を得るための意味ネットワークに基づくパーザを開発した。ここでは、意味・対話・タスクレベルの論理的制約と各単語に付与された確率を統合して推論を行なう。 (5)音声理解システムの構築と評価 (1)(2)(4)を統合した構文主導の推論方式と、(1)(3)(4)を統合した意味主導の推論方式に基づくシステムをそれぞれ実現した。両方式を語彙数244・単語パープレキシティ80のタスクで評価を行なった。文法に沿った定型的な発話に対しては、構文主導の方式が意味理解率65.5%であり、意味主導の方式の44.0%をかなり上回った。しかし、文法を逸脱した発話に対しては、意味主導の方式が頑強であることがわかった。
|