Research Abstract |
本研究は,膠着語の性質に着目した多言語間翻訳システムの開発を目的とする.本年度は,その中でも,ウイグル語-日本語機械翻訳システムを目指して,以下の研究を行った. 1.日本語形態素解析システムの改良 本研究に先立ち,派生文法に基づく形態素解析システムMAJOを開発してきたが,これには日本語の音韻変化処理用のプログラムが組込まれていた.そのため,他の言語に応用する際には,音韻変化処理部を変更する必要があり,汎用性という面で問題があった.そこで,本研究では,MAJOから音韻変化処理部を分離し,別のモジュールを作成した.この音韻変化処理モジュールは,正規表現の形で与えられた音韻変化規則に基づいて,音韻変化した形である異形態を自動的に生成する.これにより,プログラム自体の変更なしで他の言語にも応用可能な形態素解析システムへとMAJOを改良した. 2.ウイグル語形態素解析への応用 ウイグル語には,母音調和,狭母音化,子音の有声化などの音韻規則があり,その変化は日本語よりも複雑である.こうした変化を取り扱うために,まずウイグル語を派生文法で記述し,その音韻変化規則を体系化した.その結果を,1.で作成した音韻変化処理モジュールに与え,ウイグル語の異形態を作成した.さらに,ウイグル語の接尾辞の整理と辞書登録,品詞間の接続規則を記述してウイグル語形態素解析を実現した.実際のシステムには,1.で改良したMAJOを使用した. 3.ウイグル語-日本語機械翻訳システムの開発. 2.で作成したウイグル語形態素解析システムは,ウイグル語を単語ごとに分割して出力するが,その各単語に対応する日本語訳を付加して,ウイグル語-日本語機械翻訳システムのプロトタイプとした.今後,日本語の音便規則などを処理する日本語整形モジュールと組み合わせることで,より実用的なウイグル語-日本語機械翻訳システムの実現を目指す.
|