研究概要 |
本研究では,実用的規模の言語テキストに対して,これまでよりも深いレベルの意味理解を高性能に行うことを目的として,名詞の意味・用法をより深いレベルで記述した意味辞書を,大規模テキストデータから半自動的に構築する手法の研究を行った.本年度の研究項目は次の2点である. 1.実際の言語テキストデータにおける語の用法を計算機で解析し,人間は意味辞書記述のために必要な最小限の判断を下すにとどめるというアプローチにより,辞書記述者の作業コスト及び主観の混入をできるだけ抑えた名詞意味辞書構築手法を開発した. 2.名詞意味辞書の利用法の一つとして,構築された名詞意味辞書を用いて名詞固有表現の意味表現を付与する手法を開発した. まず,第1点については,名詞意味辞書の種となる初期意味知識を与え,その初期意味知識,および,大規模テキスト中から抽出された統計的共起情報を用いて,ブートストラップ的に名詞意味辞書を拡張していく方式について研究を行なった.名詞意味辞書構築において有用と考えられる共起関係としては,i)名詞と動詞・形容詞との共起,及び,ii)複合名詞,名詞-助詞相当句-名詞(「名詞_1の名詞_2」,「名詞_1のための名詞_2」,「名詞_1による名詞_2」など)といった名詞二語の共起に着目し,これらの共起情報を最大限に活用して名詞意味辞書を効率よく構築する方式の調査を行なった.また,種として与える初期意味知識の量・質と意味辞書構築の効率の相関関係の分析を行なった. 第2点については,教師あり学習により名詞固有表現を抽出するプログラムを学習する際に,第1点において構築された名詞意味辞書を有効に活用することにより,抽出される固有表現の豊富な意味表現を同時に付与する方式について研究を行なった.
|