研究課題/領域番号 |
09680373
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 京都大学 |
研究代表者 |
中村 順一 京都大学, 総合情報メディアセンター, 教授 (30164304)
|
研究分担者 |
吉田 郷子 九州工業大学, 情報科学センター, 講師 (90240910)
|
研究期間 (年度) |
1997 – 1998
|
研究課題ステータス |
完了 (1998年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
1998年度: 800千円 (直接経費: 800千円)
1997年度: 1,300千円 (直接経費: 1,300千円)
|
キーワード | 機械翻訳 / 統計的手法 / 対訳データ / 構文情報 |
研究概要 |
機械翻訳の研究は一定の成果を挙げているが、訳語選択など、深い意味処理が必要な部分は、十分なものでは無く、記号処理の限界が明らかになって来た。このため、統計的な手法が注目され、多くの研究が行われている。そこで、本研究では機械翻訳において、記号処理と統計処理の融合を図る研究を行ってきた。対象言語としては、日本語とハングル語を用い、機械翻訳の処理の中でも訳語選択のアルゴリズムに注目し、記号処理を補完するためには統計情報として何が必要か、また、それをどのようにして収集すれば良いかを明らかにしてきた。 具体的には以下の項目について調査し、研究を行ってきた。 1. 研究代表者らは、従来から韓日翻訳ツールの研究を行っているが、このツールを用いて訳語選択における問題点を明らかにし、同時に対訳データの蓄積を進めてきた。 2. 統計処理には、構文構造の対応付きの対訳データが必要であるが、これを既存の対訳文章から自動的に求めるアルゴリズムを実現する研究を行ってきた。これには、既存の英仏の対訳付けの研究(Martin Kay等)を参考にして検討した結果を用いた。
|