研究実績の概要 |
本研究は,社会のグローバル化に伴い必要な日本法に関する情報を即時に,かつ国際的に発信するために,法令改正に伴う英訳法令の修正を支援する機械翻訳技術の開発と計算機環境の構築を目的とする.本年度は主に次の成果を得た. ① 新旧対照・日英対訳法令文コーパスの構築: 機械翻訳開発用の学習データを構築した.ただし,翻訳役務にかかる予算と作業期間の制約により,構築手法を変更した.法務省・日本法令外国語訳データベースシステム(JLT)から法令日英対訳法令データ(XML形式)を取得し,国立国会図書館「日本法令索引」掲載の当該法令の沿革情報をもとに,同一法令の日英対訳データのうち複数の改正バージョンがあるものについて,隣接バージョン247組を獲得した.次に,隣接バージョン間ごとに新旧原文,新旧訳文の4要素からなる法令文の組を集積した.さらに,新旧原文間の差分に対して,新旧対照表における傍線付与ルールに準拠して<Line>タグを付与した. ② 法令文校正手法の開発: 法令文中に出現する法令用語について,その用法に基づいて適切に修正(校正)する手法を開発した.本手法はランダムフォレスト分類器を用い,当該用語の前後の文脈から適切な用語を推測する.現行3,983法令中の法令文1,223,084文を用いた実験の結果,約92%の正解率が得られ,本手法が従来手法よりも有効であることを明らかにした.本手法は,英訳文中における訳語の修正方法の基礎となる. ③ 法令沿革データベースの設計・開発: 改正前後の法令データを管理するための法令沿革データベースをLOD (Linked Open Data) として設計した.新規制定・改正など法制執務に関する概念をRDFスキーマとして記述し,プロパティ17種類を定義した.また,「日本法令索引」から取得した法律13,440件に対する沿革情報を用いて,LODを構築した.
|