本研究は、言語知識の獲得と、それに基づくネットワーク構造解析器の開発を交互に繰り返すことによって、精度の高い言語知識とネットワーク構造解析器を構築する。平成25年度は、次の3つの項目について研究開発を行った。 1) ネットワーク構造解析器のプロトタイプシステムの改良・洗練: 平成24年度までに構築したネットワーク構造解析器のプロトタイプシステムの改良および洗練を行い、より頑健なシステムとした。システムの改良は、ネットワーク構造解析のコーパスへの適用と、その解析結果からの 言語知識獲得のループを繰り返すことによって行った。また、プロトタイプシステムを整備し、実用的に使えるレベルのシステムとした。このシステムはKNP 4.1として一般に広く公開し、さまざまな言語処理アプリケーションの基盤技術として利用可能なものとなっている。 2) 獲得した言語知識の整備・公開: 言語知識の整備・公開は、二つの方法で行う。一つは、言語資源としてデータそのものを配布し、自然言語処理研究者が自由に使える知識源とする。もう一つには、検索インタフェースを作成し、言語処理技術をもたない文系の研究者および一般の言語学習者などにも使えるものにする。前者については、言語資源協会(GSK)からの配布手続きを進めており、近々公開できる見込みである。後者については、検索インタフェースをすでに公開している。また、獲得した言語知識の人手評価は難しいため、情報検索システムを使った外部評価を行い、その有効性を確認した。 3) ネットワーク構造解析に基づく情報検索システムの開発: アプリケーションとして、ネットワーク構造解析に基づく情報検索システムを開発した。これは、網羅性の高い言語知識に基づいてテキストをネットワーク構造化することによって、検索漏れや不適切な検索結果が格段に少ない情報検索システムである。
|