• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

日本法情報の国際的発信:ハイブリッド機械翻訳と法令LODによる法令改正への対応

Research Project

Project/Area Number 21H03772
Research InstitutionNagoya University

Principal Investigator

外山 勝彦  名古屋大学, 情報学研究科, 教授 (70217561)

Project Period (FY) 2021-04-01 – 2024-03-31
Keywords法情報処理 / 法令翻訳 / 法制執務 / リーガルテック / 機械翻訳 / 自然言語処理
Outline of Annual Research Achievements

本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.特に,法令の改正部分に対する英訳だけを修正し,非改正部分に対する英訳は可能な限り旧訳を用いる機械翻訳手法の開発と,日英対訳や英訳だけの修正前後,改正前後,効力の上位下位など法令間の種々の関係の記述手法の設計および日英対訳法令リンクト・データベースの構築を推進する.
本年度は主に次の成果を得た.
① 新旧対照・日英対訳条文コーパスの増強: 機械翻訳用学習データとして,法務省JLT最新改正バージョンの原文(旧原文)とその訳文(旧訳文),総務省e-Gov現行バージョンの原文(新原文)をもとに,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文1,657組を新たに作成し,過年度作成分と合わせて5,954組に増強した.
② 差分機械翻訳技術の開発・評価: 昨年度開発のCopiable Translation Transformer(CTT)と①のコーパスを用いた機械翻訳実験の結果は,BLUE値は75.8,RIBES値は93.4,また,訳文修正の極小性評価指標ISDITの値は78.3であった.今年度のコーパスサイズ増加率は大きくないため,増強効果は限定的であった.一方,大規模対訳コーパス391,758組を用いたSMTベースの従来手法のBLUE値は83.1であった.また,四つ組法令文398,950組を人工的に生成して用いる手法では,RIBES値は94.5,ISDIT値は84.2であり,それらはCTTによる値を上回った.①のコーパスは,既存または人工的に生成した大規模コーパスの1.5%程度のサイズに過ぎないが,CTTは大規模コーパスを用いる手法に匹敵する性能を発揮することを確認できた.

Research Progress Status

令和5年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和5年度が最終年度であるため、記入しない。

  • Research Products

    (10 results)

All 2024 2023

All Journal Article (2 results) (of which Peer Reviewed: 1 results,  Open Access: 2 results) Presentation (8 results)

  • [Journal Article] Differential-Aware Transformer for Partially Amended Sentence Translation2023

    • Author(s)
      Takahiro Yamakoshi, Yasuhiro Ogawa, Katsuhiko Toyama
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 13859 Pages: 5-22

    • DOI

      10.1007/978-3-031-29168-5_1

    • Peer Reviewed / Open Access
  • [Journal Article] 歴史情報としての法令データベースの構築2023

    • Author(s)
      佐野 智也、外山 勝彦、駒水 孝裕、増田 知子
    • Journal Title

      デジタルアーカイブ学会誌

      Volume: 7 Pages: s142-s145

    • DOI

      10.24506/jsda.7.s2_s142

    • Open Access
  • [Presentation] 変更極小性を考慮した改正後法令文翻訳手法2024

    • Author(s)
      山腰貴大, 小川泰弘, 外山勝彦
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 民事第一審判決書のXMLデータ化2024

    • Author(s)
      前田郁勝, 小川泰弘, 外山勝彦
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 用語制約が多い翻訳に対する手法の提案2024

    • Author(s)
      加藤優吾, 小川泰弘, 外山勝彦
    • Organizer
      言語処理学会第30回年次大会
  • [Presentation] 決算短信における業績予測文のブートストラップを用いた抽出と極性付与2023

    • Author(s)
      平松悠太, 小川泰弘, 外山勝彦
    • Organizer
      第20回テキストアナリティクス・シンポジウム
  • [Presentation] 個人向けテキスト難易度測定システムの評価2023

    • Author(s)
      澤柳翔太, 小川泰弘, 外山勝彦
    • Organizer
      第20回テキストアナリティクス・シンポジウム
  • [Presentation] 法令変遷の連続的把握のための法令データベースの構築2023

    • Author(s)
      佐野智也, 外山勝彦, 駒水孝裕, 増田知子
    • Organizer
      情報ネットワーク法学会第23回研究大会
  • [Presentation] 決算短信における業績予測文の抽出と極性付与2023

    • Author(s)
      平松悠太, 小川泰弘, 外山勝彦
    • Organizer
      令和5年度電気・電子・情報関係学会東海支部連合大会
  • [Presentation] 個人向けテキスト難易度測定2023

    • Author(s)
      澤柳翔太, 小川泰弘, 外山勝彦
    • Organizer
      令和5年度電気・電子・情報関係学会東海支部連合大会

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi