1998 Fiscal Year Annual Research Report
日本語学習者の作文コーパス:電子化による共有資源化
Project/Area Number |
08558020
|
Research Institution | Nagoya University |
Principal Investigator |
大曽 美恵子 名古屋大学, 国際言語文化研究科, 教授 (30262918)
|
Co-Investigator(Kenkyū-buntansha) |
小森 早江子 中部大学, 国際関係学部, 助教授 (60221248)
外池 俊幸 名古屋大学, 情報メディア教育センター, 教授 (80180157)
杉浦 正利 名古屋大学, 国際開発研究科, 助教授 (80216308)
白井 英俊 中京大学, 情報科学部, 助教授 (10134462)
市川 保子 東京大学, 留学生センター, 教授 (70223089)
|
Keywords | 日本語学習者 / 作文コーパス / 誤用 / CHILDFS |
Research Abstract |
最終年度の今年は作文データに誤用の分析を入力する作業を継続して行った。データの入力はChildesのchatフォーマットに修正を加えて完成した入力フォーマットに従って行い、分析は分析ティア(%als:)に記入することとした。分析入力は先ず研究協力者に依頼し、自然言語でなぜ誤用と見なされるかを記入してしてもらった。その際、後の検索を容易にするため、別途用意した分析用キーワードをなるべく使ってもらうこととした。しかしこの作業は高度の分析力を必要とし、研究協力者には処理しきれないところがあるため、入力終了後、共同研究者が各々の作文ファイルに目を通し、必要な訂正を加えた。また、各作文の入力がフォーマットに従っているかどうかはcheckerプログラムを作成し、それをかけることによって確認した。 この二つの作業終了後、公開に備えて、作文に現れた個人名をイニシャルに変えるなど、プライバシー保護のための修正を加えた。 上記作業と並行して、データ利用のための検索ツールを開発した。 6月には日本認知科学会第15回大会において本研究の概要を発表した。 また本研究の先行研究となる『日本語の普遍性と個別性に関する理論的及び実証的研究』 (1985-89年代表者、井上和子)の一環である「外国人学習者の日本語誤用例の収集・整理と分析」(分担者、寺村秀夫)のデータをワークステーションにのせ、申し込みがあれば、研究用として利用してもらえるように設定した。 最終的に利用可能になったデータと検索ツールを使って、報告書に記載した研究論文の執筆にあたった。これらの論文は言語学、言語習得、言語教育、誤用の計算機処理と多岐にわたり、作文データの意義と利用法の一端を示すものである。 今後は更に日本語学習者作文データの整備、拡充を続けていきたいと考えている。
|