本研究課題では,同じ意味内容を表す同一言語の異なる言語表現(言い換え)を幅広く収集,整理し,類型化した.分析対象の事例は,言語学,自然言語処理,言語教育等の多分野の文献からの抽出,含意関係認識のベンチマーキング用に作成されたデータ中の事例の人手による分解,機械翻訳の質が向上するように人間によって試みられた原文の書き換え,の3種類の方法で収集した.そして,従来研究と同様に言い換え対象の範囲,同義性を説明するための言語学的な要素に関する情報のほか,言い換えによって生じうる言外の意味の違い,言い換え生成時に評価すべき文脈要素などの情報を付与しつつ,類型化の基準の外在化を試みた.
|