2020 年度実績報告書

法令改正に伴う英訳法令修正を支援する環境の構築：ハイブリッド機械翻訳に基づく手法

研究課題

研究課題/領域番号	18H03492
研究機関	名古屋大学
研究代表者	外山勝彦名古屋大学, 情報基盤センター, 教授 (70217561)
研究期間 (年度)	2018-04-01 – 2021-03-31
キーワード	法情報処理 / 法令翻訳 / 法制執務 / 機械翻訳 / 自然言語処理
研究実績の概要	本研究は，社会のグローバル化に伴い必要な日本法に関する情報を即時に，かつ国際的に発信するために，法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする．本年度は主に次の成果を得た． ① 新旧対照・日英対訳法令文コーパスの構築：　機械翻訳用学習データの構築について，JLT最新改正バージョンの原文（旧原文），その訳文（旧訳文），e-Gov現行バージョンの原文（新原文）からなる三つ組法令文43,894文（隣接改正バージョン462組）を昨年度に作成したが，そのうち1,550文に対して，新原文の訳文（新訳文）を人手で作成し，新旧原文，新旧訳文からなる四つ組法令文を増強した．四つ組法令文は合計14,264文（同296組）となった． ② ハイブリッド機械翻訳技術の開発・評価：　翻訳メモリを用いた統計的機械翻訳（TM-SMT）とニューラル機械翻訳（NMT）を融合したハイブリッド機械翻訳（HMT）手法を開発した．まず，新原文に対してTM-SMTにより暫定新訳文を生成する．また，同じ新原文に対するNMT (Transformer使用) の出力中から，Monte Carlo Dropoutとビームサーチを用いてn-bestの新訳文を生成し，そのうち暫定新訳文に最類似のものを最終新訳文とする．これにより，訳文の適切性・修正極小性に対するTM-SMTの有利性と，訳文の流暢性に対するNMTの有利性を活かす．さらに，修正極小性の評価指標Focalityを設計した．学習データとして対訳法令文158,928文（407法令），実験データとして四つ組法令文158文を用いた実験の結果，Focality値は小酒井のTM-SMT単独の場合が最も高かったが，それとTransformerを融合したHMTはBLUE値，RIBES値ともに最も高く，Focality値も遜色がないことを明らかにした．
現在までの達成度 (段落)	令和2年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和2年度が最終年度であるため、記入しない。

研究成果
(5件)

すべて 2021 2020

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (3件) (うち国際学会 1件)

[雑誌論文] Differential Translation for Japanese Partially Amended Statutory Sentences2021
- 著者名/発表者名
  Takahiro Yamakoshi, Takahiro Komamizu, Yasuhiro Ogawa, Katsuhiko Toyama
- 雑誌名
  
  New Frontiers in Artificial Intelligence: JSAI-isAI 2020 Conference and Workshops, Revised Selected Papers, Lecture Notes in Computer Science
  
  巻: 未定ページ: 未定
- 査読あり / オープンアクセス
[雑誌論文] Japanese Mistakable Legal Term Correction using Infrequency-aware BERT Classifier2020
- 著者名/発表者名
  Takahiro Yamakoshi, Takahiro Komamizu, Yasuhiro Ogawa, Katsuhiko Toyama
- 雑誌名
  
  人工知能学会論文誌
  
  巻: 35 ページ: E-K25_1-17
- DOI
  10.1527/tjsai.E-K25
- 査読あり / オープンアクセス
[学会発表] Differential Translation for Japanese Partially Amended Statutory Sentences2020
- 著者名/発表者名
  Takahiro Yamakoshi, Takahiro Komamizu, Yasuhiro Ogawa, Katsuhiko Toyama
- 学会等名
  14th Int. Workshop on Juris-informatics
- 国際学会
[学会発表] 法令沿革LOD構築のためのDBpediaにおける法令エンティティの同定2020
- 著者名/発表者名
  駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  人工知能学会セマンティックウェブとオントロジー研究会
[学会発表] 事前学習モデルBERTによる法令用語の校正2020
- 著者名/発表者名
  山腰貴大, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  2020年度人工知能学会全国大会

2020 年度 実績報告書

法令改正に伴う英訳法令修正を支援する環境の構築：ハイブリッド機械翻訳に基づく手法

研究代表者

外山 勝彦 名古屋大学, 情報基盤センター, 教授 (70217561)

研究成果

[雑誌論文] Differential Translation for Japanese Partially Amended Statutory Sentences2021

著者名/発表者名

雑誌名

[雑誌論文] Japanese Mistakable Legal Term Correction using Infrequency-aware BERT Classifier2020

著者名/発表者名

雑誌名

DOI

[学会発表] Differential Translation for Japanese Partially Amended Statutory Sentences2020

著者名/発表者名

学会等名

[学会発表] 法令沿革LOD構築のためのDBpediaにおける法令エンティティの同定2020

著者名/発表者名

学会等名

[学会発表] 事前学習モデルBERTによる法令用語の校正2020

著者名/発表者名

学会等名

2020 年度実績報告書

外山勝彦名古屋大学, 情報基盤センター, 教授 (70217561)