研究概要 |
自然な文を生成するシステムの研究開発を行った。特に対話システムに対して有効な方法として、コーパスから獲得される知識と人手で与えられた知識の融合を図った。本研究において次のような成果が挙げられた。 1 柔軟な構文解析システムの構築 語の用法は構文構造から獲得される.特に副詞は人間とコンピュータとの自然言語対話において用いられることが多く、そのような環境においては従来扱いが困難であった非文が出現することが多い。このため、Nグラムを用いた柔軟な構文解析技法を開発し、理論的にすべての文を許容でき、再現率が英語に対し85%以上、日本語に対し76%以上と従来の人手で構築された構文解析と同等の性能を得ることができた。 2 副詞についてのモデル化、統計的情報の獲得 本研究においては時間副詞に関する知識を開発した。このモデルにおいては、述語(名詞、動詞、形容詞、形容動詞のいずれかで構成される文の意味を表す主要な要素)のタイブによってどのような意味が副詞によって規定されるかを表すことができる。述語のタイプは用言の種類、アスペクト、テンス、ムードによって分類される。これを一般の副詞に拡張し、知識データベースを構築した。知識データベースを構築する上で、どのような述語と共起するかをコーパスで調査し、副詞が付加する意味をこの共起情報によって分類した。この方法はオノマトペまで含む広い副詞的な表現に拡張可能な方法である。 3 対話システムの構築 従来形態素情報に基づく手法によって、事例に基づく対話システムを構築してきた。これを拡張し、構文的な要素によって、入力文と事例とのマッチングを行う方法を開発した。これによって、文の中心的な意味を表すキーワードだけでなく、係り受け関係を用いた事例の選択を行うことができた。また,係り受け情報を使い,従来のスロット方式の文生成に比べてより広い範囲の自然な文を生成することが可能になった.
|