研究課題/領域番号 |
16200009
|
研究種目 |
基盤研究(A)
|
研究機関 | 京都大学 |
研究代表者 |
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
|
研究分担者 |
宇津呂 武仁 京都大学, 情報学研究科, 講師 (90263433)
山本 和英 長岡技術科学大学, 電気系, 講師 (40359708)
|
キーワード | 機能表現 / 機能表現用例コーパス / 複合辞 / 語構成 / 境界認定 / 言い換え / 文末整形 / 電子化辞書 |
研究概要 |
本年度は、以下の研究を行なった。 (1)電子化辞書の整備と境界認定 言い換えのための語彙的知識の集積の中心となる、電子化辞書の整備を行なった。具体的には、表記の整理を行ない、各語にIDと難易度を割り当て、一番基本となる5000語の範囲をほぼ確定させた。形態素解析との連携では、語を認定するのでなく、語と語の境界を認定するという新しい方式を提案し、実際にシステムを実装した。辞書の整備および境界認定の研究の過程で、品詞と用法の関係をどのように整理すべきかいう新しい問題が明らかになり、さらなる作業が必要であることが判明した。本年度は、まず、副詞を対象に、形態と用法の整理作業を進めた。 (2)機能表現の収集と整理 複数の形態素がひとまとまりとなって、文中で機能的に働く表現(機能表現あるいは複合辞と呼ぶ)は、日本語において数多く存在し、これを正しく認定することが文解析では不可欠である。本年度は、機能表現(約500)を整理した辞書を作成するとともに、形態素解析システムと連携して、与えられた文に含まれる機能表現を検出・認定するシステムを試作した。さらに、機能表現の用例(正例と負例)のコーパスを設計し、実際に新聞記事から用例を収集してコーパスを作成する作業を行なった。 (3)言い換えの研究 核となる言い換えペアと語構成に基づいた変換規則により、類似した一連の言い換え表現を生成する枠組を提案し、形容詞・形容動詞を中核とした表現に対して実装した。これとは独立に、要約作成のための文末の整形の研究と、時制や態を考慮したサ変名詞の動詞化の研究を行なった。
|