研究課題/領域番号 |
13480097
|
研究機関 | 京都大学 |
研究代表者 |
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
|
研究分担者 |
柏岡 秀紀 (株)エイ・ティ・アール, 音声言語コミュニケーション研究所, 主任研究員
|
キーワード | 言い換え / 書き換え / 言い換え規則の学習 / テキストの合成演算 / 言い換え用ソフトウエア |
研究概要 |
本年度は、以下の4点を中心に行なった。 【1.辞書定義文の分析と言い換え表現の抽出】 辞書の定義文から見出し語を言い換える表現を抽出するための調査・分析を行った。辞書の定義文で見出し語(用言)を定義する主なパターンは、(1)同義語、(2)格要素+用言、(3)連用修飾語+用言、(4)用言+用言、の4つであり、これらのパターンを利用することにより、見出し語に対する言い換え表現を自動的に抽出するプログラムを作成した。 【2.言い換え用ソフトウェアの開発】 形態素列の一部を別の形態素列に書換える汎用の書換えシステムを作成した。本システムは、プログラミング言語Perlと統合されており、特定の言い換え用のモジュールを比較的簡単に作成することができる。本システムを使って、実際に、役所言葉を改善するシステムと製品情報をマークアップするシステムを試作した。 【3.用言の言い換え規則の学習】 用言が複数の語義を持つ場合、単に用言に対して言い換え表現を準備するだけでは不十分であり、語義の判定とそれに基づく言い換え表現の選択を行なう必要がある。これを実現するために、国語辞典から得られる情報とコーパスから得られる格フレームの情報を統合して、用言の言い換え規則を自動学習する方法を考案した。 【4.テキストの合成演算の実現】 2つのテキストを1つのテキストにまとめるという操作をテキストの合成演算として定式化し、それに基づき日本語テキストの合成システムを試作した。
|