アンケート調査票にこたえる形式で、留学生に実際に日本語を自由作文、キーボード入力させ、その過程(起動中のパソコンの画面)を信号変換してビデオテープに録画した。先行研究で、音韻面からの分析用におなじ手つづきでえられたデータと平成12年度にえられたデータが、238名分(131時間、98000文字、母語47種)ある。平成13年度に、東京外国語大学のほかに、愛知県立大学、鈴鹿国際大学、南山大学、愛知教育大学、金沢大学などでデータ収集をおこない、あらたに110名分(38時間、41000文字、新規母語10種)のデータがえられた。 平成13年度は、特に、漢字の知識の有無の影響をしらべるために、中国籍の朝鮮族と韓国人、中国籍のモンゴル族とモンゴル人の入力データを比較することを計画し、重点的にデータを収集した。 記録したビデオテープを再生チェックして、電子テキスト化し、1回の入力訂正を1データとして、入力テキスト、訂正がおこなわれた項目(品詞、時制、接続など)、入力者の母語、日本語学習歴のラベルをつけてデータベース化をすすめている。現在までに処理がおわったデータは、360名分、約20000件である。
|