研究実績の概要 |
本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.本年度は主に次の成果を得た. ① 新旧対照・日英対訳法令文コーパスの構築: 機械翻訳用学習データの構築について,JLT最新改正バージョンの原文(旧原文),その訳文(旧訳文),e-Gov現行バージョンの原文(新原文)からなる三つ組法令文43,894文(隣接改正バージョン462組)を昨年度に作成したが,そのうち1,550文に対して,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文を増強した.四つ組法令文は合計14,264文(同296組)となった. ② ハイブリッド機械翻訳技術の開発・評価: 翻訳メモリを用いた統計的機械翻訳(TM-SMT)とニューラル機械翻訳(NMT)を融合したハイブリッド機械翻訳(HMT)手法を開発した.まず,新原文に対してTM-SMTにより暫定新訳文を生成する.また,同じ新原文に対するNMT (Transformer使用) の出力中から,Monte Carlo Dropoutとビームサーチを用いてn-bestの新訳文を生成し,そのうち暫定新訳文に最類似のものを最終新訳文とする.これにより,訳文の適切性・修正極小性に対するTM-SMTの有利性と,訳文の流暢性に対するNMTの有利性を活かす.さらに,修正極小性の評価指標Focalityを設計した.学習データとして対訳法令文158,928文(407法令),実験データとして四つ組法令文158文を用いた実験の結果,Focality値は小酒井のTM-SMT単独の場合が最も高かったが,それとTransformerを融合したHMTはBLUE値,RIBES値ともに最も高く,Focality値も遜色がないことを明らかにした.
|