2015 Fiscal Year Annual Research Report
多言語の対照分析に基づく言語横断的な言い換え分類体系の構築
Project/Area Number |
25730139
|
Research Institution | National Institute of Information and Communications Technology |
Principal Investigator |
藤田 篤 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所多言語翻訳研究室, 主任研究員 (10402801)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 言い換え / パラフレーズ / 類型化 / 自然言語処理 |
Outline of Annual Research Achievements |
本研究では,同一言語において同じ意味を持つ表現(言い換え)に関する網羅的な分類体系を,日本語,英語の比較対照に基づいて構築した.昨年度までの研究において,当初計画における事例収集手法(内省および作例に基づく方法)の問題点が明らかになったため,今年度はまず新たに,より多様かつ大規模な事例を収集するための目的指向型の課題を設計した.具体的には,所与の機械翻訳システムによって得られる翻訳の質が向上するように,機械翻訳の入力文を意味を変えないように漸次的に書き換える,という間接的ではあるが明確な目的を有する課題を定義し,作業従事者を制御するためのプロトコルおよびシステムを開発した.そして,実際にその手法を用いて約13,000件の日本語言い換え事例および約2,300件の英語言い換え事例を収集し,それらの分解・類型化作業を経て,53種類からなる類型にまとめた.作業従事者によって蓄積される書き換え事例の中に,意味が変化してしまう事例や複数の言い換えが組み合わさった非プリミティブな事例が含まれてしまうため,選別および分解の作業が別途必要である.ただし,事例そのものは作業時間に応じて増やすことができるので,本研究課題の目的である多様な事例の収集,類型化の根拠となる事例および手がかりの整理に対しては,問題とはならない.
|
Research Products
(4 results)