2021 Fiscal Year Annual Research Report
日本法情報の国際的発信:ハイブリッド機械翻訳と法令LODによる法令改正への対応
Project/Area Number |
21H03772
|
Research Institution | Nagoya University |
Principal Investigator |
外山 勝彦 名古屋大学, 情報基盤センター, 教授 (70217561)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 法情報処理 / 法令翻訳 / 法制執務 / リーガルテック / 機械翻訳 / 自然言語処理 |
Outline of Annual Research Achievements |
本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.特に,法令の改正部分に対する英訳だけを修正し,非改正部分に対す る英訳は可能な限り旧訳を用いる機械翻訳手法の開発と,日英対訳や英訳だけの修正前後,改正前後,効力の上位下位など法令間の種々の関係の記述手法の設計および日英対訳法令リンクト・データベースの構築を推進する. 本年度は主に次の成果を得た. ①新旧対照・日英対訳法令文コーパスの増強: 機械翻訳用学習データとして,法務省JLT最新改正バージョンの原文(旧原文)とその訳文(旧訳文),総務省e-Gov現行バージョンの原文(新原文)をもとに,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文1,670組を新たに作成し,合計3,221組に増強した. ②旧訳文に対する新訳文の修正極小性の評価指標として,以前に提案したFocalityを改良して,ISDIT(Inclusive Score for DIfferential Translation)を設計した.これは,旧訳文中の単語nグラムの再現率だけでなく,新訳文の妥当性も考慮した指標である. ③ハイブリッド機械翻訳技術の開発・評価: 前年度までに開発した統計的機械翻訳(TM-SMT)とニューラル機械翻訳(NMT)を融合したハイブリッド機械翻訳(HMT)手法を用い,①のコーパスを学習データとして機械翻訳実験を行ったところ,BLUE値で平均5.6ポイント,ISDIT値で平均2.6ポイントの性能向上が見られ,学習データのサイズ増強の効果を確認できた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
学習データのサイズ増強により機械翻訳の性能が向上することを期待した通り確認できた.また,より適切な評価指標を設計できた.
|
Strategy for Future Research Activity |
法令改正に伴う英訳法令の修正を支援する機械翻訳の開発については,法令文四つ組コーパスのさらなる増強を検討する.また,機械翻訳性能のいっそうの向上を図るために,新訳文における次単語の出力時に旧訳文の単語と比較し,尤度が高い方を選択する方法を新たに開発し,翻訳実験を行う. また,法令間の種々の関係を大量の法令文書データから洗い出し,RDFスキーマの記述手法の開発に着手する.その際,すでに開発した法令沿革リンクト・データベースのRDFスキーマを拡張・改良する.
|
Research Products
(3 results)