2022 Fiscal Year Annual Research Report
日本法情報の国際的発信:ハイブリッド機械翻訳と法令LODによる法令改正への対応
Project/Area Number |
21H03772
|
Research Institution | Nagoya University |
Principal Investigator |
外山 勝彦 名古屋大学, 情報学研究科, 教授 (70217561)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 法情報処理 / 法令翻訳 / 法制執務 / リーガルテック / 機械翻訳 / 自然言語処理 |
Outline of Annual Research Achievements |
本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.特に,法令の改正部分に対する英訳だけを修正し,非改正部分に対する英訳は可能な限り旧訳を用いる機械翻訳手法の開発と,日英対訳や英訳だけの修正前後,改正前後,効力の上位下位など法令間の種々の関係の記述手法の設計および日英対訳法令リンクト・データベースの構築を推進する. 本年度は主に次の成果を得た. ① 新旧対照・日英対訳条文コーパスの増強: 機械翻訳用学習データとして,法務省JLT最新改正バージョンの原文(旧原文)とその訳文(旧訳文),総務省e-Gov現行バージョンの原文(新原文)をもとに,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文1,477組を新たに作成し,合計4,498組に増強した. ② 差分機械翻訳技術の開発・評価: 新訳文における次単語の出力時に旧訳文の次単語と比較し,尤度が高い方を選択する方法(Copiable Transformer)を開発した.①の新旧対照・日英対訳条文コーパスを用いて機械翻訳実験を行った結果,BLUE値は60.9であり,また,昨年度に設計した訳文修正の極小性評価指標ISDITの値は51.6であった.これらはTransformerのみを用いた従来手法のBLUE値28.8,ISDIT値14.31を大幅に凌駕した.なお,学習コーパスのサイズの増加につれて,性能が向上することも確認した. ③ 日英対訳法令LODの設計: RDFスキーマのうち,特に,法令の改正前後の関係の表現手法について基本設計を行った.これは以前に設計した法令沿革リンクト・データベースのRDFスキーマを法令単位から項単位へ拡張したものである.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
新旧対照・日英対訳条文コーパス(四つ組法令文コーパス)を学習データとしたCopiable Transformerの性能は期待どおりであった. また,法令の改正前後の間を項単位で関係づける方法を設計したことにより,法令沿革リンクト・データベースの構築の基礎を固めることができた.
|
Strategy for Future Research Activity |
約40万文からなる大規模な日英対訳法令コーパスを学習データとし,一昨年度までに開発したハイブリッド機械翻訳手法(テンプレート利用の統計的機械翻訳(TM-SMT)とニューラル機械翻訳(Transformer)を組み合わせた手法)のBLUE値は83.0,ISDIT値は74.1であり,今年度に開発したCopiable Transformerの性能は,それにまだ及ばない.機械的に生成する手法の検討も含めて新旧対照・日英対訳条文コーパスのいっそうの増強を行い,翻訳性能の向上を図る.一方で,別の翻訳手法についても検討する.
|
Research Products
(3 results)