2018 年度実績報告書

法令改正に伴う英訳法令修正を支援する環境の構築：ハイブリッド機械翻訳に基づく手法

研究課題

研究課題/領域番号	18H03492
研究機関	名古屋大学
研究代表者	外山勝彦名古屋大学, 情報基盤センター, 教授 (70217561)
研究期間 (年度)	2018-04-01 – 2021-03-31
キーワード	法情報処理 / 法令翻訳 / 機械翻訳 / 法制執務 / 自然言語処理
研究実績の概要	本研究は，社会のグローバル化に伴い必要な日本法に関する情報を即時に，かつ国際的に発信するために，法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする．本年度は主に次の成果を得た． ① 新旧対照・日英対訳法令文コーパスの構築：　機械翻訳開発用の学習データを構築した．ただし，翻訳役務にかかる予算と作業期間の制約により，構築手法を変更した．法務省・日本法令外国語訳データベースシステム（JLT）から法令日英対訳法令データ（XML形式）を取得し，国立国会図書館「日本法令索引」掲載の当該法令の沿革情報をもとに，同一法令の日英対訳データのうち複数の改正バージョンがあるものについて，隣接バージョン247組を獲得した．次に，隣接バージョン間ごとに新旧原文，新旧訳文の4要素からなる法令文の組を集積した．さらに，新旧原文間の差分に対して，新旧対照表における傍線付与ルールに準拠して<Line>タグを付与した． ② 法令文校正手法の開発：　法令文中に出現する法令用語について，その用法に基づいて適切に修正（校正）する手法を開発した．本手法はランダムフォレスト分類器を用い，当該用語の前後の文脈から適切な用語を推測する．現行3,983法令中の法令文1,223,084文を用いた実験の結果，約92%の正解率が得られ，本手法が従来手法よりも有効であることを明らかにした．本手法は，英訳文中における訳語の修正方法の基礎となる． ③ 法令沿革データベースの設計・開発：　改正前後の法令データを管理するための法令沿革データベースをLOD (Linked Open Data) として設計した．新規制定・改正など法制執務に関する概念をRDFスキーマとして記述し，プロパティ17種類を定義した．また，「日本法令索引」から取得した法律13,440件に対する沿革情報を用いて，LODを構築した．
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由 1. 学習データの構築に時間を要した．これは，予算と作業時間の制約に伴い，その手法を変更したうえ，新旧バージョン間での条文テキストの正確性の確認は手作業で行ったこと，それらの差分を表示するためのタグ付け作業は作業用ツールを開発してから実施したことによる． 2. 機械翻訳の手法として，ニューラル機械翻訳にソフトテンプレートを導入する手法を考案した．本手法は，原文と類似度の高い文を学習データから検索し，その訳文を翻訳のソフトテンプレートとし，それを書き換えて訳文を出力するものである．JLTで公開されている日英対訳705法令（356,323文）を用いて実験を行い，評価指標BLUE，RIBES，ROUGEを用いて翻訳性能を評価したが，ソフトテンプレートを用いない手法に比べて，顕著な性能向上は見られず，ソフトテンプレートが不必要に書き換えられ，訳文として不適切な文が出力された例があった．すなわち，ソフトテンプレートの与え方について改良の余地が多い．
今後の研究の推進方策	機械翻訳と翻訳メモリに基づく翻訳を融合したハイブリッド機械翻訳の手法として，新たに，法令の一部改正に伴う訳文の修正を英語法令文の校正とみなす手法を開発する．その際，校正箇所は原文の差分から獲得する．そのために，すでに開発した法令用語の修正（校正）支援手法を拡張する．前年度に構築した新旧対照・日英対訳条文コーパスを学習データとして，その性能を評価する．また，一部改正前後の法令テキスト（改正バージョン）を管理するための法令沿革データベースの設計と開発を引き続き推進し，公布日と施行日の関係などに留意したRDFスキーマをより詳細に設計する．さらに，英訳修正支援GUIツールの全体設計を引き続き行う．このツールは，新旧条文対照表編集，新訳文生成（翻訳），新訳文編集，新旧訳文対照表生成の4機能をもつ．

研究成果
(9件)

すべて 2019 2018

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (7件)

[雑誌論文] Hierarchical Coordinate Structure Analysis for Japanese Statutory Sentences Using Neural Language Models2018
- 著者名/発表者名
  Yamakoshi Takahiro、Ohno Tomohiro、Ogawa Yasuhiro、Nakamura Makoto、Toyama Katsuhiko
- 雑誌名
  
  Journal of Natural Language Processing
  
  巻: 25 ページ: 393～419
- DOI
  10.5715/jnlp.25.393
- 査読あり / オープンアクセス
[雑誌論文] Japanese Legal Term Correction using Random Forests2018
- 著者名/発表者名
  Takahiro Yamakoshi, Takahiro Komamizu, Yasuhiro Ogawa, Katsuhiko Toyama
- 雑誌名
  
  Legal Knowledge and Information Systems, JURIX 2018: The 31th Annual Conference
  
  巻: 1 ページ: 161-170
- DOI
  10.3233/978-1-61499-935-5-161
- 査読あり / オープンアクセス
[学会発表] 法令沿革オントロジーの設計2019
- 著者名/発表者名
  内田勇志, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  人工知能学会セマンティックウェブとオントロジー研究会
[学会発表] 部分構造を用いた類似例規の検索2019
- 著者名/発表者名
  藤岡和弥, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  第11回データ工学と情報マネジメントに関するフォーラム（第17回日本データベース学会年次大会）
[学会発表] ニューラルモデルと翻訳メモリを併用した機械翻訳2018
- 著者名/発表者名
  重野泰和，駒水孝裕，小川泰弘，外山勝彦
- 学会等名
  平成30年度電気・電子・情報関係学会東海支部連合大会
[学会発表] ランダムフォレストによる法令用語の校正2018
- 著者名/発表者名
  山腰貴大, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  平成30年度電気・電子・情報関係学会東海支部連合大会
[学会発表] 単語の分散表現を用いた法令用語間の関係の獲得2018
- 著者名/発表者名
  植原リサ, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  平成30年度電気・電子・情報関係学会東海支部連合大会
[学会発表] Zipfの法則は例規文の出現数においても成立する2018
- 著者名/発表者名
  藤岡和弥, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  平成30年度電気・電子・情報関係学会東海支部連合大会
[学会発表] 並列構造の分割による法令文の読解性向上2018
- 著者名/発表者名
  青山恵子, 駒水孝裕, 小川泰弘, 外山勝彦
- 学会等名
  平成30年度電気・電子・情報関係学会東海支部連合大会

2018 年度 実績報告書

法令改正に伴う英訳法令修正を支援する環境の構築：ハイブリッド機械翻訳に基づく手法

研究代表者

外山 勝彦 名古屋大学, 情報基盤センター, 教授 (70217561)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Hierarchical Coordinate Structure Analysis for Japanese Statutory Sentences Using Neural Language Models2018

著者名/発表者名

雑誌名

DOI

[雑誌論文] Japanese Legal Term Correction using Random Forests2018

著者名/発表者名

雑誌名

DOI

[学会発表] 法令沿革オントロジーの設計2019

著者名/発表者名

学会等名

[学会発表] 部分構造を用いた類似例規の検索2019

著者名/発表者名

学会等名

[学会発表] ニューラルモデルと翻訳メモリを併用した機械翻訳2018

著者名/発表者名

学会等名

[学会発表] ランダムフォレストによる法令用語の校正2018

著者名/発表者名

学会等名

[学会発表] 単語の分散表現を用いた法令用語間の関係の獲得2018

著者名/発表者名

学会等名

[学会発表] Zipfの法則は例規文の出現数においても成立する2018

著者名/発表者名

学会等名

[学会発表] 並列構造の分割による法令文の読解性向上2018

著者名/発表者名

学会等名

2018 年度実績報告書

外山勝彦名古屋大学, 情報基盤センター, 教授 (70217561)