研究課題/領域番号 |
13480091
|
研究機関 | 新潟大学 |
研究代表者 |
宮崎 正弘 新潟大学, 工学部, 教授 (80221612)
|
研究分担者 |
新田 義彦 日本大学, 経済学部, 教授 (20277370)
柴田 勝征 福岡大学, 理学部, 教授 (50028213)
池原 悟 鳥取大学, 工学部, 教授 (70283968)
池田 尚志 岐阜大学, 工学部, 教授 (10232183)
|
キーワード | 機械翻訳 / パターン翻訳 / 意味類型 |
研究概要 |
1.要素合成法を基本とする従来の自然言語処理の限界を克服することを狙って、意味類型と類推層考の2つの観点から異なる言語間で論理的な意味範疇を介して対応付けられた意味類型化された文型パターン(表現構造パターン)を用いて言語の等価変換を行う機構の基本検討を進めた。 意味類型の観点では、「人間の対象把握作用には、思考形式とも言うべきある種のフレームワークが存在し、それが言語表現に反映される」とする考えに基づき、表現構造の意味的な単位化を行う。すなわち、言語表現から意味的に非線形な表現構造をパターン化して取り出し,人間の持つ対象把握作用の形式とみなせる表現構造を意味類型パターンとし、構造的な単位とする。次に、類推思考の観点からは、等価的類推思考の原理を言語に適用し、原言語の表現構造を言語共役な概念項を介して、目的言語の表現構造に写像する。 2.比較表現、因果表現などの日英対訳用例を収集・分析し、日英文型パターン化、日英意味類型化を試行し、意味類型化された日英文型パターン構築における問題点を抽出した。 3.日英翻訳プロトタイプシステムの基本検討を行い、単文の範囲を超えた大域構造、単文、単文の部分である名詞句/複合語に対して、異なった変換パスをもつ日英変換部の機能・構成を定めた。 4.日英翻訳プロトタイプシステムの構成要素となる以下の処理モジュールの試作・改良を進めた。 (1)日本語形態素解析システムMaja:複合名詞解析、同形語判別を強化。 (2)日本語構文解析前処理部:品詞、字面等の表層的情報を用いて、複雑な構造をもつ日本語長文から単文範囲を推定し、日本語文パーザにおける構造的曖昧さの増大を抑止可能とする。 (3)日本語文パーザSGLR-plus/J:一般化LR法をProlog上に実現した拡張型のSGLRパーザ(SGLR-plus)上に補強項付のDCG形式で日本語文法を記述し、統語的な構造である表現構造と話者の対象認識の反映である認識構造を抽出する機能をもつ。単文境界を越える部分木を抑止する制御機構により、正しい解析木を落とすことなく解析木数を大幅に削減できる。 (4)英語文生成システムRecog-S/E:データベース化された表現構造/認識構造対データを用い、用例生成の手法によって英語の認識構造から表現構造を介して英語文を生成する。
|