研究課題/領域番号 |
16652044
|
研究機関 | 名古屋大学 |
研究代表者 |
杉浦 正利 名古屋大学, 大学院・国際開発研究科, 教授 (80216308)
|
研究分担者 |
木下 徹 名古屋大学, 大学院・国際開発研究科, 教授 (90177890)
山下 淳子 名古屋大学, 大学院・国際開発研究科, 助教授 (00220335)
井佐原 均 独立行政法人通信総合研究所, けいはんな情報通信融合研究センター, 自然言語グループリーダー (20358881)
大名 力 名古屋大学, 大学院・国際開発研究科, 助教授 (00233205)
|
キーワード | 誤用分析 / 学習者コーパス / 第二言語習得 / 自然言語処理 / エラーアナリシス / NICT JLE Corpus |
研究概要 |
1.データの整備 研究分担者の井佐原が中心となって構築した日本人英語学習者の話し言葉コーパスであるNICTコーパスのうち、167ファイルをテキストファイルで入手しサーバー上に保存し、作業環境を整備した。データの整形プログラムを開発し、機械的なデータの整形を行なった後に、大学院生3名による目視による確認と修正作業を行なった。(途中で、大本のNICTコーパスに修正が加えられたため、本プロジェクトのデータ整形作業も、途中でやり直しをせざるを得なくなり、プロジェクトの進行が、予定よりも若干遅れることになった。) 2.英語母語話者による書き換え文の付与 学習者の発話のすべてを英語母語話者に添削を依頼し、間違っている部分や不自然な部分を含む文を、単語や構文はできるだけもとのままで自然な英文に書き換え、コーパスに加える作業を行なった。本年度は、167ファイルのうち、事前に作業が終っていた20ファイルのほかに、80ファイルについて書き換え文の付与作業を行ない、合計100ファイルに書き換え文の付与作業を行なった。 3.「誤り」表現の抽出プログラムの開発 研究分担者の大名により開発された学習者の文と英語母語話者の文のパラレルデータを比較し違っている部分を明示的に表示するプログラムの仕様を検討し、本プロジェクトが目指している「誤り」表現の抽出プログラムの開発に必要な条件を検討した。本プロジェクトの進行が若干遅れたため、実際の「誤り」表現の抽出プログラムの開発は次年度に行なうこととした。 4.「誤り」データベースの分析 「誤り」データベースの分析に必要な誤用分析の手法と誤用の類系に関する先行研究を調査し、「誤り」データベースの分析の枠組を検討した。「誤り」表現抽出プログラムの開発が遅れたため、実際の「誤り」データベースの分析自体は、次年度に行なうこととした。
|