研究概要 |
本研究は,政策法務業務の増大に対応するために必要な日本語法令文の作成と,国際社会のグローバル化に対応するために必要な日本語法令文の英訳に対して,計算機を用いて作業支援することを目的とする.本年度は,主に以下の成果を得た. 1.法令ターミノロジーの構築:国立印刷局・官報データベースから抽出して構築した官報法律コーパス(昭和22~平成24年,法律9,915本)から延べ14,874個(異なり9,368個)の定義語を抽出した.その抽出精度は91.0%であった.しかし,括弧書きによる定義語の抽出再現率は39.2%に留まった.また,抽出された語義文には他の法文や法令を引用しているものが多く見られたので,その照応の解決を図った.そこで,法令を構造化するとともに,相対アドレス指定の引用表記に対して,正規表現を用いて絶対アドレスをタグ付けしたところ,タグ付け精度は88.0%であった.また,相対アドレス指定による引用表記のうち64.3%が絶対アドレス指定に正しく書き換えられた. 2.言語資源検索GUIツールの開発:戦後占領期の英文官報に掲載された法律(1,624本)に対する文対応付き日英対訳コーパスを用い,対訳表現抽出用GUIとしてBilingual KWIC(R)を構築した.また,チャンキングに基づく方法では90,709語,出現文書頻度に基づく方法では69,657語の日本語用語候補を抽出した. 3.「法令のあらまし」の日英統計的機械翻訳手法の開発:法令の要約文書である「法令のあらまし」の日英統計的機械翻訳手法について基礎的な技術を開発した.法令文日英対訳コーパス(276,597文)を学習データとし,「法令のあらまし」日英対訳300文を開発データとしてデコーダのパラメータ調整を行い,機械翻訳システムの自動評価指標RIBESなどを用いて評価したところ,本手法は有効であることを明らかにした.
|