研究課題/領域番号 |
04044108
|
研究種目 |
国際学術研究
|
配分区分 | 補助金 |
応募区分 | 共同研究 |
研究機関 | 大阪大学 |
研究代表者 |
溝口 理一郎 大阪大学, 産業科学研究所, 教授 (20116106)
|
研究分担者 |
OH YungーHwan 韓国科学技術院, 電子計算機学科, 教授
来村 徳信 大阪大学, 産業科学研究所, 助手 (20252710)
山下 洋一 大阪大学, 産業科学研究所, 助手 (80174689)
池田 満 大阪大学, 産業科学研究所, 助手 (80212786)
YUNGーHWAN Oh 韓国科学技術院, 電子計算機学科, 助教授
|
研究期間 (年度) |
1992 – 1993
|
研究課題ステータス |
完了 (1993年度)
|
配分額 *注記 |
8,200千円 (直接経費: 8,200千円)
1993年度: 2,000千円 (直接経費: 2,000千円)
1992年度: 6,200千円 (直接経費: 6,200千円)
|
キーワード | 音声認識 / 音声理解 / 韓国語 / ファジイ / 対話モデル / ATMS / ファジィ |
研究概要 |
音声によるコンピュータとの対話を実現するために不可欠な技術課題として、音声の認識と理解、非単調推論(ATMS)、対話を管理するモデルの構築等を取り上げ、それぞれの技術的課題を解決するための基礎技術について研究を行なった。 1.本研究開始までに日本語に対して既に開発されていた知識工学的手法に基づく音声認識の枠組みを韓国語に対して適用し、有効に動作することを確認した。さらに、特徴パラメータの記号化および認識単位の選択法において本手法の改良を行った。音声認識ルールの記述を柔軟にするため、数値ではなく「高い」「増加する」などの言葉を使って規則を記述し、ファジイ処理によって特徴パラメータの記号化を行う。また、音声のセグメンテーションの問題を回避するため、物理的特徴の変化の極小点を境界とした不均一単位を認識対象とした。このような物理的特徴に基づいた単位を用いると単位の種類が増加するため、認識ルールの自動生成手法も導入している。認識結果として不均一単位の候補が決定された後、単位間の接続性を考慮した後処理を行い、最終的な認識結果を得る。本手法を韓国語の連続数字認識に適用し、97%の認識率を得た。 2.音声理解における自然言語処理を困難なものにしている要因の一つとして、音韻認識の不確実さに起因する候補数の増大が挙げられる。このような曖昧さを解消しつつ、与えられた音声に対する単語列を同定するためには、音声の持つ音響情報以外に高次の情報として言語情報や対話に関する情報を効果的に援用していかなければならない。そこで、音声理解のための言語処理方式として、ATMSに基づく方式を開発し、音声認識において生じる曖昧性を効率良く解消するための枠組みを示した。具体的には、文を意味的にまとまった「大きな句」と「小さな句」の二種類の単位で捉え、最適な組み合わせを探索する。音声認識の結果得られる文節ラティスから「小さな句」に相当する文構成要素を抽出し、文の構造を推定する。推定された構文のうち、もっともらしいものから順に文節候補を確定できるかどうかを単語の意味蘇生を用いて調べる。このような処理がATMS上に構築されており、一度行った推論の結果が有効に再利用される。日本語の8文章に対して評価実験を行った結果、総実行時間が64秒から45秒に減少した。 3.まず、音声による対話の特徴を調べるために、ある状況を設定して行う模擬対話の収録を行った。得られた対話例を分析することによって、「発話の対」および「意味的なまとまり」の二種類の構造が一般に対話に見られることを確認した。対話構造のモデル化に当たっては、汎用性の高い対話管理手法を実現するために、計算機側のシステム(問題解決器)に依存した知識とそうでない汎用的な知識に分離することによって、領域に依存しないような対話構造のモデル化を行なった。前者の構造に対しては、要求-応答といったやり取りを一つのプランとして捉えるSRプランによってモデル化する。対話例に見られたやり取りを分類・整理することによって、17個のプランを同定した。後者に対しては、発話の「話題」に注目した話題遷移モデル(TPN)を提案した。このモデルは関連話題をパケットにまとめ、さらにそれをネットワーク上に接続したものである。さらに、発話対を表現するSRプランにおいて、発話対の種類ごとに発話のパターンを分類整理し、話題に依存する発話の構成要素を明らかにした。このような対話モデルに基づいて、対話音声理解における発話の予測メカニズム手法を開発した。発話における話題を話題遷移モデルに基づいて決定し、さらに発話対に基づいた発話のパターンを話題によって具体化する。曖昧性を含んだ音声認識結果として分節ラティスを想定し、「案内」をタスクとした対話例に関して、本手法の有効性を検証した。
|