• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

日本法情報の国際的発信:ハイブリッド機械翻訳と法令LODによる法令改正への対応

研究課題

研究課題/領域番号 21H03772
研究機関名古屋大学

研究代表者

外山 勝彦  名古屋大学, 情報学研究科, 教授 (70217561)

研究期間 (年度) 2021-04-01 – 2024-03-31
キーワード法情報処理 / 法令翻訳 / 法制執務 / リーガルテック / 機械翻訳 / 自然言語処理
研究実績の概要

本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.特に,法令の改正部分に対する英訳だけを修正し,非改正部分に対する英訳は可能な限り旧訳を用いる機械翻訳手法の開発と,日英対訳や英訳だけの修正前後,改正前後,効力の上位下位など法令間の種々の関係の記述手法の設計および日英対訳法令リンクト・データベースの構築を推進する.
本年度は主に次の成果を得た.
① 新旧対照・日英対訳条文コーパスの増強: 機械翻訳用学習データとして,法務省JLT最新改正バージョンの原文(旧原文)とその訳文(旧訳文),総務省e-Gov現行バージョンの原文(新原文)をもとに,新原文の訳文(新訳文)を人手で作成し,新旧原文,新旧訳文からなる四つ組法令文1,657組を新たに作成し,過年度作成分と合わせて5,954組に増強した.
② 差分機械翻訳技術の開発・評価: 昨年度開発のCopiable Translation Transformer(CTT)と①のコーパスを用いた機械翻訳実験の結果は,BLUE値は75.8,RIBES値は93.4,また,訳文修正の極小性評価指標ISDITの値は78.3であった.今年度のコーパスサイズ増加率は大きくないため,増強効果は限定的であった.一方,大規模対訳コーパス391,758組を用いたSMTベースの従来手法のBLUE値は83.1であった.また,四つ組法令文398,950組を人工的に生成して用いる手法では,RIBES値は94.5,ISDIT値は84.2であり,それらはCTTによる値を上回った.①のコーパスは,既存または人工的に生成した大規模コーパスの1.5%程度のサイズに過ぎないが,CTTは大規模コーパスを用いる手法に匹敵する性能を発揮することを確認できた.

現在までの達成度 (段落)

令和5年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和5年度が最終年度であるため、記入しない。

  • 研究成果

    (10件)

すべて 2024 2023

すべて 雑誌論文 (2件) (うち査読あり 1件、 オープンアクセス 2件) 学会発表 (8件)

  • [雑誌論文] Differential-Aware Transformer for Partially Amended Sentence Translation2023

    • 著者名/発表者名
      Takahiro Yamakoshi, Yasuhiro Ogawa, Katsuhiko Toyama
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 13859 ページ: 5-22

    • DOI

      10.1007/978-3-031-29168-5_1

    • 査読あり / オープンアクセス
  • [雑誌論文] 歴史情報としての法令データベースの構築2023

    • 著者名/発表者名
      佐野 智也、外山 勝彦、駒水 孝裕、増田 知子
    • 雑誌名

      デジタルアーカイブ学会誌

      巻: 7 ページ: s142-s145

    • DOI

      10.24506/jsda.7.s2_s142

    • オープンアクセス
  • [学会発表] 変更極小性を考慮した改正後法令文翻訳手法2024

    • 著者名/発表者名
      山腰貴大, 小川泰弘, 外山勝彦
    • 学会等名
      言語処理学会第30回年次大会
  • [学会発表] 民事第一審判決書のXMLデータ化2024

    • 著者名/発表者名
      前田郁勝, 小川泰弘, 外山勝彦
    • 学会等名
      言語処理学会第30回年次大会
  • [学会発表] 用語制約が多い翻訳に対する手法の提案2024

    • 著者名/発表者名
      加藤優吾, 小川泰弘, 外山勝彦
    • 学会等名
      言語処理学会第30回年次大会
  • [学会発表] 決算短信における業績予測文のブートストラップを用いた抽出と極性付与2023

    • 著者名/発表者名
      平松悠太, 小川泰弘, 外山勝彦
    • 学会等名
      第20回テキストアナリティクス・シンポジウム
  • [学会発表] 個人向けテキスト難易度測定システムの評価2023

    • 著者名/発表者名
      澤柳翔太, 小川泰弘, 外山勝彦
    • 学会等名
      第20回テキストアナリティクス・シンポジウム
  • [学会発表] 法令変遷の連続的把握のための法令データベースの構築2023

    • 著者名/発表者名
      佐野智也, 外山勝彦, 駒水孝裕, 増田知子
    • 学会等名
      情報ネットワーク法学会第23回研究大会
  • [学会発表] 決算短信における業績予測文の抽出と極性付与2023

    • 著者名/発表者名
      平松悠太, 小川泰弘, 外山勝彦
    • 学会等名
      令和5年度電気・電子・情報関係学会東海支部連合大会
  • [学会発表] 個人向けテキスト難易度測定2023

    • 著者名/発表者名
      澤柳翔太, 小川泰弘, 外山勝彦
    • 学会等名
      令和5年度電気・電子・情報関係学会東海支部連合大会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi