2010 Fiscal Year Annual Research Report
日本語文の意味構造解析技術確立に向けた意味構造タグ付きコーパスの作成と応用
Project/Area Number |
22800078
|
Research Institution | National Institute of Informatics |
Principal Investigator |
松林 優一郎 国立情報学研究所, コンテンツ科学研究系, 特任研究員 (20582901)
|
Keywords | 述語鋼構造解析 / 語彙概念構造 / コーパス設計 / 自然言語処理 / 語彙意味論 |
Research Abstract |
当該年度の研究では、述語項構造タグ付きコーパス作成時に必要となる、解析の規範・基準となる意味論を構築した。具体的には、その基本的な枠組みとしてLexical Conceptual Structure(LCS:語彙概念構造)を採用し、これを実際のコーパスに出現する多様な述語表現を説明出来る形に拡張した。コーパス主導型の分析では、様々な言語現象が多種多様に現れるため、その基軸となる理論には高い一般性と頑健性が求められる。そのような背景から、語彙概念構造の表現形式を厳密性、一般性、柔軟性の観点で拡張し、日本語動詞の比較的広い範囲を説明することの出来る理論を構築した。また、拡張した理論を用いて、実際に対象コーパス中に頻出する述語に対して語彙概念構造を定義し、理論の頑健性を確認した。 さらに、これらの過程において、第一に、これまで既存の述語項構造解析の枠組みでは不明瞭であった意味役割ラベルの定義を、拡張された語彙概念構造を用いて基本となる意味機能に分解することにより、より明示的に説明できることを示した。第二に、上記で各述語に対して定義した概念構造を利用すれば、述語構造間の汎化された意味的関係を自動的に計算できることを示した。この枠組みを利用することで、述語項構造を解析したテキスト同士の、簡単な言い換え関係を特定することが出来るため、近年盛んに研究されている言い換え・含意関係認識といった応用技術において、語彙概念構造による解析の枠組みが利用できる可能性を示したと言える。
|