機械翻訳の研究は一定の成果を挙げているが、訳語選択など、深い意味処理が必要な部分は、十分なものでは無く、記号処理の限界が明らかになって来た。このため、統計的な手法が注目され、多くの研究が行われている。そこで、本研究では機械翻訳において、記号処理と統計処理の融合を図る研究を行ってきた。対象言語としては、日本語とハングル語を用い、機械翻訳の処理の中でも訳語選択のアルゴリズムに注目し、記号処理を補完するためには統計情報として何が必要か、また、それをどのようにして収集すれば良いかを明らかにしてきた。 具体的には以下の項目について調査し、研究を行ってきた。 1. 研究代表者らは、従来から韓日翻訳ツールの研究を行っているが、このツールを用いて訳語選択における問題点を明らかにし、同時に対訳データの蓄積を進めてきた。 2. 統計処理には、構文構造の対応付きの対訳データが必要であるが、これを既存の対訳文章から自動的に求めるアルゴリズムを実現する研究を行ってきた。これには、既存の英仏の対訳付けの研究(Martin Kay等)を参考にして検討した結果を用いた。
|