研究実績の概要 |
昨年度に引き続き、学習者コーパスデータの収集を行った。今年度は、2クラスを対象にCriterionを使った英文エッセイライティングの授業を行いデータを収集した。多くの受講生がデータ提供に同意してくれたが、受講者数が予測を少し下回ったため、2クラスあわせて約60名分のデータを収集した。 これまでに収集したデータと合わせて約230人・述べ約1,800ファイルとなったが、データ収集時のテーマの出題順のカウンターバランスをとることを考慮し、1クラス分のデータを除き、バランスをとったデータセットを本研究で構築・分析対象とする縦断的学習者コーパスのメインデータ(約200名弱・約1,500ファイル)とすることとした。除いた1クラス分は、目的に応じて利用する補助データとした。データ収集後の整形作業はおおむね完了し、コーパス全体の整理・統合を本年度中に行うことができた。 昨年度までに確立したStanford ParserとDisco-DOPを使ってのデータ処理を、今年度収集したデータのみならず、これまでに収集したデータのメインデータ全体に対して行い、構文部分木の頻度一覧表を作成した。構文部分木の総タイプ数はおよそ6万項目となった。また、母語話者の産出データに基づいた構文部分木の頻度一覧表も作成し、学習者データ全体と母語話者データ全体の上位500の構文部分木の対数化頻度の相関を分析し相関係数0.77という結果を得た。今後は、他の言語的特長とあわせて詳しく分析していく必要がある。 視線計測の本実験については、分析対象を与格交替の構文に定め、Visual World Paradigmによる実験を行った。その結果、母語話者では構文の違いによる影響が一部見られたものの、学習者では見られない結果となった。
|