2023 Fiscal Year Annual Research Report
日本法情報の国際的発信:ハイブリッド機械翻訳と法令LODによる法令改正への対応
Project/Area Number |
21H03772
|
Research Institution | Nagoya University |
Principal Investigator |
外山 勝彦 名古屋大学, 情報学研究科, 教授 (70217561)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 法情報処理 / 法令翻訳 / 法制執務 / リーガルテック / 機械翻訳 / 自然言語処理 |
Outline of Annual Research Achievements |
本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.特に,法令の改正部分に対する英訳だけを修正し,非改正部分に対する英訳は可能な限り旧訳を用いる機械翻訳手法の開発と,日英対訳や英訳だけの修正前後,改正前後,効力の上位下位など法令間の種々の関係の記述手法の設計および日英対訳法令リンクト・データベースの構築を推進する. 本年度は主に次の成果を得た. ① 新旧対照・日英対訳条文コーパスの増強: 機械翻訳用学習データとして,法務省JLT最新改正バージョンの原文(旧原文)とその訳文(旧訳文),総務省e-Gov現行バージョンの原文(新原文)をもとに,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文1,657組を新たに作成し,過年度作成分と合わせて5,954組に増強した. ② 差分機械翻訳技術の開発・評価: 昨年度開発のCopiable Translation Transformer(CTT)と①のコーパスを用いた機械翻訳実験の結果は,BLUE値は75.8,RIBES値は93.4,また,訳文修正の極小性評価指標ISDITの値は78.3であった.今年度のコーパスサイズ増加率は大きくないため,増強効果は限定的であった.一方,大規模対訳コーパス391,758組を用いたSMTベースの従来手法のBLUE値は83.1であった.また,四つ組法令文398,950組を人工的に生成して用いる手法では,RIBES値は94.5,ISDIT値は84.2であり,それらはCTTによる値を上回った.①のコーパスは,既存または人工的に生成した大規模コーパスの1.5%程度のサイズに過ぎないが,CTTは大規模コーパスを用いる手法に匹敵する性能を発揮することを確認できた.
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|
Research Products
(10 results)