本研究の目的は、自治体文書を対象に、機械翻訳を活用した日本語文書の多言語展開を促進する枠組みを構築・検証し、原文書作成を支援するシステムを開発・評価することである。本年度は、特に以下の研究を進めた。 (1) 文書構造に応じた執筆規則の作成:すでに定式化している自治体の手続きに関する文書構造をもとに、各文書要素に応じた望ましい言語表現を日本語と英語の両方で定義しながら、執筆規則を作成した。例えば、手順を説明する文書要素中では、日本原文では平叙文「~する」を用い、翻訳英文では命令形(Do ... の形)を用いる、と定めた。さらに、文書構造上の位置に応じた柔軟な訳し分けを、機械翻訳を用いて実現するために、翻訳前処理ルールを作成し、その有効性を検証した。 (2) 自治体分野の日英対訳用語集の作成と評価:自治体の生活情報に関するテキストから人手で用語を抽出し、さらにそこで観察された表記揺れを解消することで、約3000語からなる日英対訳の制限用語集を構築した。また用語集の十分性を統計的に推定した結果、現在の用語集は、自治体生活情報分野の用語を約50~60%カバーしていることが明らかになった。 (3) オーサリング支援システムの開発とパイロット評価:非専門的な執筆者が、読みやすくかつ翻訳しやすい構造化文書を作成するための、統合的なオーサリング支援環境の開発を進めた。文レベルの執筆を支援するモジュールの有用性をユーザ実験により評価した結果、本モジュールを使用することで、原文書き換え効率が30%以上改善されることが示された。 以上の研究成果は、国内外の学会で発表している他、産業関係者に向けたシンポジウムでも発表した。
|