アンケート調査票にこたえる形式で、留学生に実際に日本語を自由作文、キーボード入力させ、その過程(起動中のパソコンの画面)を信号変換してビデオテープに録画した。先行研究で、音韻面からの分析用におなじ手つづきでえられたデータが、175人分(97時間、68000文字、母語36種)ある。平成12年度に、東京外国語大学西ヶ原キャンパスで1回、朝日町キャンパスで10回、住吉町キャンパスで13回、愛知県立大学で1回、電気通信大学で2回、弘前大学で1回のデータ収集をおこない、あらたに83人分(34時間、30000文字、新規母語11種)のデータがえられた。 記録したビデオテープを再生チェックして、電子テキスト化し、1回の入力訂正を1データとして、入力テキスト、訂正がおこなわれた項目(品詞、時制、接続など)、入力者の母語、日本語学習歴のラベルをつけて、データベース化しつつある。現在までに処理がおわったデータは220人分、約13500件である。 たとえば、データを品詞別に分類すると、その数は、名詞、動詞、助詞、形容詞、副詞の順になり、助詞の中では「に」に関するデータがもっともおおいことがわかった。今後データ数をふやして、入力者の母語・日本語学習歴別の特徴を分析する予定である。
|