研究実績の概要 |
本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.特に,法令の改正部分に対する英訳だけを修正し,非改正部分に対す る英訳は可能な限り旧訳を用いる機械翻訳手法の開発と,日英対訳や英訳だけの修正前後,改正前後,効力の上位下位など法令間の種々の関係の記述手法の設計および日英対訳法令リンクト・データベースの構築を推進する. 本年度は主に次の成果を得た. ①新旧対照・日英対訳法令文コーパスの増強: 機械翻訳用学習データとして,法務省JLT最新改正バージョンの原文(旧原文)とその訳文(旧訳文),総務省e-Gov現行バージョンの原文(新原文)をもとに,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文1,670組を新たに作成し,合計3,221組に増強した. ②旧訳文に対する新訳文の修正極小性の評価指標として,以前に提案したFocalityを改良して,ISDIT(Inclusive Score for DIfferential Translation)を設計した.これは,旧訳文中の単語nグラムの再現率だけでなく,新訳文の妥当性も考慮した指標である. ③ハイブリッド機械翻訳技術の開発・評価: 前年度までに開発した統計的機械翻訳(TM-SMT)とニューラル機械翻訳(NMT)を融合したハイブリッド機械翻訳(HMT)手法を用い,①のコーパスを学習データとして機械翻訳実験を行ったところ,BLUE値で平均5.6ポイント,ISDIT値で平均2.6ポイントの性能向上が見られ,学習データのサイズ増強の効果を確認できた.
|