研究実績の概要 |
本研究は,社会のグローバル化に伴い必要な日本法の動きに関する情報を迅速に,かつ分かりやすく国際的に発信するための支援環境の構築を目的とする.研究期間最終年度の本年度は,主に以下の成果を得た. 1.法令文の並列構造解析手法の開発:法令文における並列構造の解析手法として,ニューラル言語モデル(NLM)に基づく手法を開発し,従来手法に比べて約25%の大幅な性能向上が見られることを明らかにした.法令文における並列構造の解析は,法令文の機械翻訳を実現するために有効な基礎技術であるとともに,並列関係にある語句の自動抽出はターミノロジーの構築にも貢献する. 2.対訳法令用語の自動抽出:「英文官報」掲載の1,624法律に対する文対応付き日英対訳コーパス(156,562文)から,統計的機械翻訳技術や語の出現頻度・出現確率,品詞出現位置の特性,形態素解析の曖昧さの補正を用いて,日英対応表現5,590語を抽出した.その対訳表現としての正解率は97.8%であり,統計的機械翻訳手法を用いた対訳表現自動抽出手法の有効性を明らかにした.また,「法令用語日英標準対訳辞書」など既存の対訳辞書との比較により,その中から新規に登録すべき対訳表現の候補838語を獲得した. 3.日本法令用ターミノロジーの構築:定義語とその語彙情報(語義,出典法律,他の用語との語彙的関係など)をXMLを用いて記述するための文書型定義を設計するとともに,それをもとに,平成27年4月1日現在で有効な定義語延べ6,890語(異なり5,077語)に対するターミノロジーを構築した.また,平成13年から平成27年まで15年間の各時点で有効な法律やガス事業法の一部改正(全41バージョン)を例として,定義語間の語彙的関係の経時変化を可視化するGUIツールを開発した.
|