• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2014 年度 実績報告書

日本法情報の即時性・理解性のある国際的発信:統計的機械翻訳に基づく支援

研究課題

研究課題/領域番号 26240050
研究機関名古屋大学

研究代表者

外山 勝彦  名古屋大学, 情報基盤センター, 教授 (70217561)

研究期間 (年度) 2014-04-01 – 2017-03-31
キーワード法律情報 / 自然言語処理 / 統計的機械翻訳 / 文書構造化
研究実績の概要

本研究は,社会のグローバル化に伴い必要な日本法の動きに関する情報を迅速に,かつ分かりやすく国際的に発信するための支援環境の構築を目的とする.本年度は,主に以下の成果を得た.
1.「法令のあらまし」の統計的機械翻訳手法の開発:大規模な法令文日英対訳コーパスを学習データとし,小規模なあらまし文日英対訳コーパスによってデコーダのパラメータを調整する手法に加えて,文末表現の「~することとした」や位取りのない漢数字表現など,あらまし文特有の表現に対応させるために,あらまし文日英対訳コーパスや漢数字表記日英対訳コーパスを学習データに追加する手法を開発した.法令文日英対訳コーパス166,977文とあらまし文日英対訳コーパス1,742文,漢数字日英対訳コーパス1,176文からなる学習コーパス,および,パラメータ調整用のあらまし文日英対訳300文を用い,あらまし文1,371文を入力とする比較実験を行い,それらの手法は有効であることを明らかにした.
2.「法令のあらまし」の文書構造化手法の開発:「法令のあらまし」用の文書型定義(DTD)を考案した.特に,階層化された箇条書きに対して見出し番号の付与ポリシーを特定するアルゴリズムを開発し,見出し番号の表記揺れに対応できるマークアップ手法を開発した.また,自動マークアップツールを開発した.
3.「法令のあらまし」対訳データベースの構築:「法令のあらまし」日英対訳構造化文書を蓄積するデータベースシステムの設計・開発を行った.そのGUIは,キーワード,公布日,翻訳日,法令番号,所管府省を検索キーとする検索機能や,原文と訳文の対応関係を日英対照表や英日交互配置により分かりやすく表示する機能を有する.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本年度までに,翻訳モデルの学習のための対訳コーパスが小規模であるという問題点の解決と,文末表現や漢数字表記など,あらまし文特有の表現への対応を考慮した統計的機械翻訳手法の基本的な開発を終え,改良すべき点について明らかにすることができた.また,「法令のあらまし」文書の構造化手法の開発も終え,自動マークアップツールの実現も完了し,同文書の構造化とその蓄積について作業の見通しを付けることができた.さらに,「法令のあらまし」対訳データベースとその公開用のGUIの設計・開発も基本的に終了し,ターミノロジーとの連携機能の設計・開発を残すだけとなった.

今後の研究の推進方策

あらまし文が長文である場合に統計的機械翻訳の性能が芳しくないという問題が生じたので,それに対処するために,あらまし文を特有の括弧表現の内外で分割して学習モデルを構築する手法を開発する.
また,文書構造化手法を確立したので,過去から現在までの「法令のあらまし」の文書構造化と蓄積に着手する.
法令ターミノロジーの構築については,その基本構造の設計を推進するともに,用語や関連情報の抽出手法とそれらコンテンツの整備を図る.

  • 研究成果

    (8件)

すべて 2015 2014

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件、 謝辞記載あり 2件) 学会発表 (6件) (うち招待講演 1件)

  • [雑誌論文] Acquisition of Hyponymy Relations for Agricultural Terms from a Japanese Statutory Corpus2014

    • 著者名/発表者名
      Makoto Nakamura, Tomohiro Ohno, Yasuhiro Ogawa, Katsuhiko Toyama
    • 雑誌名

      Information Processing in Agriculture

      巻: 1 ページ: 95-104

    • DOI

      10.1016/j.inpa.2014.11.001

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [雑誌論文] Extraction of Legal Definitions and Their Explanations with Accessible Citations2014

    • 著者名/発表者名
      Makoto Nakamura, Yasuhiro Ogawa, Katsuhiko Toyama
    • 雑誌名

      Lecture Notes in Computer Science

      巻: 8929 ページ: 157-171

    • DOI

      10.1007/978-3-662-45960-7_12

    • 査読あり / オープンアクセス / 謝辞記載あり
  • [学会発表] 括弧表現の分割による法令のあらましの翻訳精度向上2015

    • 著者名/発表者名
      岡田浩平, 小川泰弘, 大野誠寛, 中村誠, 外山勝彦
    • 学会等名
      言語処理学会第21回年次大会
    • 発表場所
      京都大学吉田キャンパス(京都府)
    • 年月日
      2015-03-18
  • [学会発表] 法令対訳コーパスからの複単語表現抽出2015

    • 著者名/発表者名
      坂本聡美, 小川泰弘, 大野誠寛, 中村誠, 外山勝彦
    • 学会等名
      言語処理学会第21回年次大会
    • 発表場所
      京都大学吉田キャンパス(京都府)
    • 年月日
      2015-03-17
  • [学会発表] 日本法令の英訳支援2015

    • 著者名/発表者名
      外山勝彦
    • 学会等名
      第6回産業日本語研究会シンポジウム
    • 発表場所
      東京大学本郷キャンパス(東京都)
    • 年月日
      2015-02-24
    • 招待講演
  • [学会発表] Daily News on Japanese Legislation toward International Sharing of Japanese Legal Information2014

    • 著者名/発表者名
      Gen Kawachi, Yasuhiro Ogawa, Makoto Nakamura, Tomohiro Ohno, Katsuhiko Toyama
    • 学会等名
      2014 Law via the Internet Conference
    • 発表場所
      Cape Town, South Africa
    • 年月日
      2014-10-01
  • [学会発表] 日本法令の情報発信に向けた法令のあらましの文書構造化2014

    • 著者名/発表者名
      河地玄, 大野誠寛, 中村誠, 小川泰弘, 外山勝彦
    • 学会等名
      平成26年度電気関係学会東海支部連合大会
    • 発表場所
      中京大学八事キャンパス(愛知県)
    • 年月日
      2014-09-09
  • [学会発表] 特有な表現に適応した「法令のあらまし」の統計的機械翻訳2014

    • 著者名/発表者名
      岡田浩平, 大野誠寛, 小川泰弘, 中村誠, 外山勝彦
    • 学会等名
      平成26年度電気関係学会東海支部連合大会
    • 発表場所
      中京大学八事キャンパス(愛知県)
    • 年月日
      2014-09-09

URL: 

公開日: 2016-06-01  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi