研究実績の概要 |
本研究は,社会のグローバル化に伴い必要な日本法の動きに関する情報を迅速に,かつ分かりやすく国際的に発信するための支援環境の構築を目的とする.本年度は,主に以下の成果を得た. 1.「法令のあらまし」の統計的機械翻訳手法の開発:大規模な法令文日英対訳コーパスを学習データとし,小規模なあらまし文日英対訳コーパスによってデコーダのパラメータを調整する手法に加えて,文末表現の「~することとした」や位取りのない漢数字表現など,あらまし文特有の表現に対応させるために,あらまし文日英対訳コーパスや漢数字表記日英対訳コーパスを学習データに追加する手法を開発した.法令文日英対訳コーパス166,977文とあらまし文日英対訳コーパス1,742文,漢数字日英対訳コーパス1,176文からなる学習コーパス,および,パラメータ調整用のあらまし文日英対訳300文を用い,あらまし文1,371文を入力とする比較実験を行い,それらの手法は有効であることを明らかにした. 2.「法令のあらまし」の文書構造化手法の開発:「法令のあらまし」用の文書型定義(DTD)を考案した.特に,階層化された箇条書きに対して見出し番号の付与ポリシーを特定するアルゴリズムを開発し,見出し番号の表記揺れに対応できるマークアップ手法を開発した.また,自動マークアップツールを開発した. 3.「法令のあらまし」対訳データベースの構築:「法令のあらまし」日英対訳構造化文書を蓄積するデータベースシステムの設計・開発を行った.そのGUIは,キーワード,公布日,翻訳日,法令番号,所管府省を検索キーとする検索機能や,原文と訳文の対応関係を日英対照表や英日交互配置により分かりやすく表示する機能を有する.
|