本研究の目的は、日本語教育の改善のための日越コーパスを開発することである。研究の初年度は、関数型コーパスの構造を決定し、それの基づき日越コーパス入力システムを開発し、コーパス入力を行った。しかし、コーパス入力規則(関数化規則)の曖昧性、属性(モダリティ属性、アスペクト属性、および非言語情報属性)のコード化の不完全性やそれに基づくコーパス入力システムの不備で、作成されたデータエラーが多く、日本語教育に有効なコーパスを完成させることができなかった。研究2年目の今年度は、この反省に鑑み、入力規則の簡素化・明確化」、「コーパス作成のための資料の厳正な選定」を行い、再びコーパスデータの入力を行った。 今年度の研究成果は、コーパス入力作業の成果以外に、以下のものがあげられる。 (1) 文の関数化分解をして出てくる関数は、次に10種のタイプがあること 動詞基本文型タイプ、名詞文基本文型タイプ、形容詞基本文型タイプ、連体修飾句タイプ、連用修飾句タイプ、文接続詞文型タイプ、体言化関数タイプ、連用句化関数タイプ、名詞句タイプ、複合関数タイプ (2) ベトナム語の場合、同音意義語が多く、文中の用語がどの概念を表すかを、Wordnetのサイセット(syset)コードで表すことが重要であること (3) 日本語関数とベトナム語関数の対応を作成するための、入力支援システム(研究当初は計画していなかったが)を開発しなければ、並列コーパスを完成することは困難なこと研究3年次目の平成23年度は、これを含めて研究の完成に向けて取り組んでいくことになる。
|