2011 Fiscal Year Annual Research Report
日本語文の意味構造解析技術確立に向けた意味構造タグ付きコーパスの作成と応用
Project/Area Number |
22800078
|
Research Institution | National Institute of Informatics |
Principal Investigator |
松林 優一郎 国立情報学研究所, コンテンツ科学研究系, 特任研究員 (20582901)
|
Keywords | 述語項構造解析 / 語彙概念構造 / コーパス設計 / 自然言語処理 / 語彙意味論 |
Research Abstract |
前年度に作成した日本語動詞に対する語彙概念構造辞書と、述語項構造解析の枠組みに基づいて、新聞記事データを主とする日本語コーパスに対して、対象とする述語表現に意味的に関わりのある句をほぼ網羅的に解析する述語項構造アノテーションを行った。本研究で対象とする意味タグは、各述語の語彙概念構造が直接説明する種類のもの(主要項)と、あらゆる述語に対して横断的に定義される種類のもの(周辺項)に分けることで、意味定義の面で見通しの良い設計を実現している。周辺項に関しては、現在までに特定の標準的なタグセットが存在しないため、実際のアノテーションに先立ち、コーパス中の文書を予め分析する事により、必要な周辺項の種類を定義した。実際のコーパスアノテーションを前提として、日本語の周辺項のタグセットを網羅的に設計するのは本研究が初の試みである。述語項構造アノテーションに関しては、構築した概念構造辞書に含まれる各述語に対して、それぞれコーパスから抽出した100事例に主要項と周辺項のタグ付けを行った。本研究で作成した述語項構造アノテーションは、既存の統語構造解析済みコーパスの上に、明確な意味機能をもった意味タグを用いてタグ付けされているため、自動的な述語項構造解析器の開発に不可欠な統語構造と意味構造の間の関係を紐解く資源として利用できる。また、コーパス作成過程において作成された述語の概念構造辞書は、言い換えや含意関係認識等の言語処理分野における応用技術のための有用な資源となるだけでなく、コーパス主導の方法で構築された現実的な根拠を有する資源として、言語学分野においても、動詞意味論等の進展の原動力として寄与することを期待できるものである。
|
Research Products
(4 results)