2021年度は、(1)機械翻訳向け前編集ルールの整理、(2)分野に特化した制限言語の構築、(3)前編集ルールを効率的に適用するための執筆支援ツールの改良を行った。 (1) 機械翻訳向け前編集ルールの整理:2020年度の研究で、前編集方法の中でも特に、原文に直接書かれていない内容をテキスト中に明示する方法(明示化方略と呼ぶ)が、機械翻訳品質の向上に寄与することが示唆された。そこで、これまで構築した人手前編集事例の分析を通じて、明示化対象表現と明示化方略の体系化を行った。具体的には、262件の最小単位の書き換え事例を対象に、どのような表現に対して(対象)、どのような書き換えがなされ(操作)、どのような情報が明示されたか(明示内容)を分析し、ボトムアップなラベル付けと集約を繰り返すことで、3カテゴリ・34サブカテゴリからなる明示化対象表現(対象)、6カテゴリ・26サブカテゴリからなる明示化方略体系(操作・明示内容)を構築した。これらは機械翻訳向け前編集ルールとして用いることができる。 (2)分野に特化した制限言語の構築:特定の分野に特化した前編集ルールの構築も進めた。自動車関連の技術文書を対象に、動詞と格フレーム、格要素、連用修飾要素、文末機能、接続表現の5つのコンポーネントからなる制限言語を構築した。この制限言語は、当該分野で使用可能な承認表現のリストを定めるだけでなく、(a)書き換え対象となる非承認表現に対する承認表現へのリンク、および(b)各表現の文中での推奨位置を定めた。 (3)前編集ルールを効率的に適用するための執筆支援ツールの改良:自動車関連の技術文書の執筆を主な対象として、2020年度に開発した日本語表現の書き換えを支援するツールのプロトタイプの改良を進めた。(2)で構築した制限言語の一部を前編集ルールとして実装し、語彙だけでなく、語順の統制を可能とした。
|