この研究では、ベトナム語と日本語のパラレルコーパスを作成し、ここからベトナム語の機能語を抽出し、日本語との機能語との対応をつけることにより、日本語-ベトナム語翻訳の精度を飛躍的に向上させることを目指す。また、機能語を中心の行われている日本語教育にこの成果を応用し、ベトナム人に対する日本語教育の効率化および高度化に貢献すること目的として進められている。 研究の進め方として、(1)日本語訳付ベトナム語文の収集、(2)日本語文の構造解析、(3)ベトナム語文の構造解析を約20000文に対して行う計画をしている。研究の第1年度は、既に収集していた約6000文の日越対応コーパス入力方法の詳細仕様決定、および構造解析にためのプログラムの開発を行った。 ベトナム語文については、文法が十分確立していないため、本方式の「関数化」が行なえない文がまだ3%くらいあるが、一応人手による関数化規則は定まり、この規則に基づいて解析を行い、約5000の関数を切り出している。しかし、データエラーも多く、引き続き品質向上に努力していかなければいけない。 日本語文については、原文が入力されただけであるが、日本語関数については、別資料から変換して作成できるので、これを先に作成して、関数分解プログラムを先に作成し、これを使って解析を行う。 その後、日越関数の対応を付ける作業に入る。作業は順調に進んでおり、終了年次までには、日越並列コーパスが完成し、日本人がベトナム語を学ぶためのテキスト、およびベトナム人が日本語(上級)を学ぶためにテキストは完成するだろう。
|