研究概要 |
意味解析技術の実現を狙って、日本語と英語の「表現意味辞書」の開発に必要な意味的構造パターンを自動的に抽出するため、大規模な日本語と英語の対訳コーパス対象に、意味的な対応関係にある表現構造を発見し抽出するためのプログラムを研究開発する。 このため,H12年度は,まず,研究用の対訳データベースとして,すでに入手済みの対訳データから20万文の対訳原文DBを作成すると共に,日本語の複文・重文のパターン,情報を抽出するのに適した文要素置き換え規則を求めた。 今年度は、上記の原文DBを使用して、日英比較表現と因果関係構文の文型パターン対をそれぞれ300件づつ作成し、ターン間の意味的関係を調べた。また、日英対訳コーパスから2回以上出現する対訳表現を自動的に抽出するアルゴリズムを考案し、その動作確認を行う一方、与えられた入力文の依存構造ともっとも一致する部分の多い文を大規模なコーパスから自動的に発見するためのアルゴリズムを考案し、それについても実験プログラムを試作して動作確認を行った
|