2003 Fiscal Year Annual Research Report
言い換えを中心としたテキスト自動編集技術とその機械翻訳への応用
Project/Area Number |
13480097
|
Research Institution | KYOTO UNIVERSITY |
Principal Investigator |
佐藤 理史 京都大学, 情報学研究科, 助教授 (30205918)
|
Co-Investigator(Kenkyū-buntansha) |
柏岡 秀紀 株式会社エイ・ティ・アール, 音声言語コミュニケーション研究所, 主任研究員
|
Keywords | 言い換え / 書き換え / テキストの規格化 / 制限言語 / 機械翻訳 / 機能表現 / 表記のゆれ |
Research Abstract |
本研究では、日本語テキストを平易に言い換えることを実現する自然言語処理技術を研究するとともに、そのような言い換えが機械翻訳の精度向上に寄与するかについても、ケーススタディを行った。本年度の主な成果は、以下の3点である。 1.語構成に基づく語彙的言い換え 語彙的言い換えは、これまで、言い換えペアを登録した辞書さえ用意すれば、簡単に実現できると考えられてきた。しかしながら、実際には、言い換えペアにおいて品詞や語構成が異なる場合、単なる置換を超えた、より複雑な現象が観察される。このような現象に対処するために、基本的な言い換えペアと語構成を利用した、新しい語彙的言い換えのための枠組みを提案した。 2.機械翻訳のための機能表現の言い換え 言い換えが機械翻訳の品質向上に寄与するかどうかの一つのテストケースとして、現在の機械翻訳システムが、機能表現「なら」をどのように訳すかを調査し、前編集において「なら」をどのように言い換えるべきかを検討した。「なら」が話題や場合限定を表す場合、「は」を中心とした表現に言い換えることによって、翻訳品質を向上させることができる。また、「なら」が観点や意見を表す慣用表現の一部である場合も、翻訳品質を向上させる、適切な言い換えが存在することがわかった。 3.異表記同語認定のための辞書編纂 言い換えでは、各種の語彙的情報の利用が不可欠であるため、言い換えの機械的実現のためには、多くの語彙的情報を統合した、語彙的情報データベースを作成することが不可欠である。このようなデータベースの作成には、いわゆる「表記のゆれ」をどのように扱うかを明確にする必要がある。ここでは、そのためのガイドラインを作成し、実際に、それに基づいて、形態素解析用の辞書を編纂した。これにより、異表記同語を機械的に認定することが可能となった。
|
Research Products
(5 results)
-
[Publications] Masatoshi Tsuchiya, Satoshi Sato: "Automatic Detection of Grammar Elements that Decrease Readability"ACL-03 Companion Volume to the Proceedings of the Conference. 189-192 (2003)
-
[Publications] 鍛治伸裕, 河原大輔, 黒橋禎夫, 佐 藤理史: "格フレームの対応付けに基づく用言の言い換え"自然言語処理. 10・4. 65-81 (2003)
-
[Publications] 松吉俊, 佐藤理史, 宇津呂武仁: "機能表現「なら」の機械翻訳のための言い換え"情報処理学会研究報告, 2004-NL-159. 201-208 (2004)
-
[Publications] 麻岡正洋, 佐藤理史, 宇津呂武仁: "語構成を利用した言い換え表現の自動生成"言語処理学会第10回年次大会発表論文集. 488-491 (2004)
-
[Publications] 土屋雅稔, 佐藤理史, 宇津呂武仁: "機能表現言い換えデータからの言い換え規則の自動生成"言語処理学会第10回年次大会発表論文集. 492-495 (2004)