本年度はとりわけ受動態の英語文がどのような場合に受動態に訳され、どのような場合に能動態に変換されるかを重点的に分析した。そのために、英日翻訳文書において英語原文、日本語下訳、日本語修正訳(完成訳)、英日機械翻訳結果に対して、原文受動態に対する関係を認定するためのタグ付けを行った。 また、コーパスに基づき機械学習手法を利用して、英語受動態に対する日本語文のぎこちなさを分析し、下訳から完成訳への修正で受動態から能動態に態が変化している要因を組み入れて態の返還候補部分を自動的に検出する手法を試行的に作成した。コーパスもアルゴリズムも継続的に拡大/改善を続けている。 初年度はもう一つ、そもそも下訳が修正されるという行為がどのように分類されるかについても整理を行った。我々の研究は「ぎこちない翻訳」の検出を目標として開始したが、実は、下訳に対する修正は、(1)誤訳の場合、(2)いわゆる英文和訳としてはよいがぎこちない場合、(3)一貫性や基準となる規則(例えば組織で決まった用語を使うなど)に対するクォリティ・コントロールという3つのレベルに分けることができることが明らかになった。修正要因の分析と自動的な修正候補の検出や翻訳者支援も、それぞれに応じた方針が必要であり、その検討も開始している。
|