研究課題/領域番号 |
13480097
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 京都大学 |
研究代表者 |
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
|
研究分担者 |
柏岡 秀紀 株式会社エイ・ティ・アール, 音声言語コミュニケーション研究所, 主任研究員
|
研究期間 (年度) |
2001 – 2003
|
研究課題ステータス |
完了 (2003年度)
|
配分額 *注記 |
15,900千円 (直接経費: 15,900千円)
2003年度: 4,900千円 (直接経費: 4,900千円)
2002年度: 5,900千円 (直接経費: 5,900千円)
2001年度: 5,100千円 (直接経費: 5,100千円)
|
キーワード | 言い換え / テキストの平易化 / テキストの規格化 / 制限言語 / 機能表現 / 機械翻訳 / 書き換え / 表記のゆれ / 言い換え辞書の自動生成 / 文の平易度 / 言い換え規則の学習 / テキストの合成演算 / 言い換え用ソフトウエア |
研究概要 |
本研究では、日本語テキストを平易に言い換えることを実現する自然言語処理技術を研究するとともに、そのような言い換えが機械翻訳の精度向上に寄付するかどうかのケース・スタディを行なった。主な成果は次の通りである。 1、辞書定義文を利用した言い換え:国語辞典の定義文から、見出し語の言い換えとなる表現を自動的に抽出することを実現した。また、用言が複数の語義を持つ場合に、国語辞典から得られる情報と、コーパスから得られる情報を統合して、用言の言い換え規則を学習する方法を提案した。 2、日本語文の規格化:文の平易化を実現するために不可欠な「平易な日本語」の規格を提案した。この規格は、表記、語彙、文法、量的複雑さの4部門からなる。また、文中に含まれる規格外表現を発見し、それに対する代替表現を提示するプログラムを試作した。 3、語構成に基づく語彙的言い換え:語彙的言い換えは、これまで言い換えペアを登録しておけば、簡単に実現できると考えられてきた。しかし、実際には、単なる置換では実現できない語彙的言い換えは多数存在する。このような言い換えを、基本的な言い換えペアと語構成規則を用いて生成する、新しい語彙的言い換えの枠組みを提案し、実装した。 4、機械翻訳のための言い換え:言い換えが機械翻訳の品質向上に実際に寄与するかどうかの一つのテストケースとして、現在の機械翻訳システムが機能表現「なら」をどのように翻訳するかを調査し、前編集で「なら」を適切に言い換えることが翻訳の品質向上に寄与することを示した。 5、異表記同語認定のための辞書編纂:言い換えの機械化のベースとなる語彙表を作成するため際に、「表記のゆれ」をどのように取り扱うべきかというガイドラインを作成し、これに基づき形態素解析用辞書を編纂した。
|