研究概要 |
本研究は,政策法務業務の増大に対応する法令文作成支援と,国際社会のグローバル化に対応する法令英訳支援のために,構文情報付き日英法令文コーパスの構築と利用のための手法を確立することを目的としている.本年度は,主に以下の成果を得た. 1.構文情報付き日本語法令文コーパス構築:日本語法令文の係り受け関係の表現手法を用い,既存の構文解析器Cabochaの出力結果に対して,係り受けタグを半自動的に付与する手法を開発した.また,それを用いて,係り受けタグを付与した2052文(12法令)からなるコーパスを構築した.さらに,誤りを含む係り受けタグに対する修正規則の獲得手法として,(1)並列表現など法令文特有の構文に対して,正規表現を用いたパターン化,(2)一般の構文に対して,同期文法を用いたコーパスからの自動獲得の2つを開発した. 2.構文情報を活用した日英法令文の検索・閲覧・編集GUIツール設計・開発: (1)日本語法令文に対して,文節単位でのKWIC表示と係り受け関係の可視化を行うツールKWISCを公開した. (2)入力キーワードが構成する依存関係を含む英文法令文を検索するツールESCORTに,日本語入力・英語出力となる言語横断機能を付与した. (3)基本句の統計的特徴を用いて,頻出表現を構文情報付き英文コーパスから自動抽出する手法を開発した.また,抽出した頻出表現の検索システムSCOPEを開発・公開した. 3.日本語法令文コーパスからの構文パターン抽出・類型化,構文情報を活用した法令用語シソーラス構築:日本語法令文中からの重要語と文脈パターンのブートスラップ型自動獲得手法Monakaに対して,グラフカーネルを用いた学習方法を導入して,性能向上を図った.
|