2002 Fiscal Year Annual Research Report
言い換えを中心としたテキスト自動編集技術の研究とその機械翻訳への応用
Project/Area Number |
13480097
|
Research Institution | Kyoto University |
Principal Investigator |
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
|
Co-Investigator(Kenkyū-buntansha) |
柏岡 秀紀 (株)エイ・ティ・アール, 音声言語コミュニケーション研究所, 主任研究員
|
Keywords | 言い換え / 書き換え / テキストの規格化 / 言い換え辞書の自動生成 / 制限言語 / 文の平易度 |
Research Abstract |
本研究の最終目標を文の平易化に定め、本年度はこれを実現するための各種技術について研究した。 文を平易化するためには、まず、平易さの基準が必要となる。この基準を、規格という形で定義した。この規格の立案に当たっては、表現力の観点と判定方法の実現可能性の観点を考慮し、日本語能力試験「出題基準」に準拠することとした。作成した日本語文の平易度の規格は、漢字、語彙、文法、量的複雑さの4部門からなり、それぞれ3段階の平易度を定義した。 次に、与えられた文の各部門の平易度を判定するプログラムを作成した。語彙の平易度判定は、形態素解析システムの辞書の各語に平易度を付加することによって実現した。漢字の平易度は、形態素解析後の結果に対するフィルターとして実現した。漢字、語彙の平易度判定の精度は、形態素解析の精度と同程度である。文法の平易度判定は、構文解析結果に対する判定規則として実現したが、判定精度には、問題が残っている。 これらの平易度判定プログラムを用いることにより、与えられた文のどの部分が難しいかが自動的に判定可能となる。文の平易化を行うためには、ここで見つかった「難しい部分」をより平易に書き換える必要がある。本年度は、この書き換えを支援するシステムとして、用言の書き換え候補を自動生成するシステムを作成した。まず、国語辞典の見出し語とその定義(説明)文から、言い換えペア(見出し語とその代替表現のペア)を抽出する。これは、定義文を構文パターンに基づいて分類し、それぞれのパタ-ンに対して代替表現として抽出すべき部分を定義することによって実現した。次に、こうして得られた言い換えペアを用いて、局所的な書き換えを実現する。単に単語を置換する場合のほかに、置換単語の前後を一部変える必要がある場合もある。これらをルールによって適切に処理する。
|
Research Products
(3 results)
-
[Publications] 佐藤理史, 土屋雅稔, 村山賢洋, 麻岡正洋, 王晴晴: "日本語文の規格化"情報処理学会研究報告2003-NL-153. 2003・4. 133-140 (2003)
-
[Publications] 村山賢洋, 麻岡正洋, 土屋雅稔, 佐藤理史: "語彙の規格化とそれに基づく用言の言い換え支援"言語処理学会第9回年次大会発表論文集. 85-88 (2003)
-
[Publications] 土屋雅稔, 佐藤理史: "文法の規格とその自動判定"言語処理学会第9回年次大会発表論文集. 89-92 (2003)