研究概要 |
本研究は,日本人英語学習者の産出単位を分析可能にする新たな学習者コーパスの構築により,日本人英語学習がどのような言語単位でコロケーション知識を保持し,運用しているのかを明らかにすることを目的としている。この研究課題に取り組むため,本年度は,以下のような研究計画を遂行した。 まず,どのようなテーマでライティングタスクを行う際に、どのような課題(作文のテーマ)設定すれば、ライティングをしやすくなるかを検討した。先行研究で扱われてきたテーマを踏まえつつ,ライティングを行う者が大学生・大学院生であることから,身近なテーマと思われる「学校教育(School Education)」というテーマを設定した。 次に,ライティング過程のリアルタイム記録システムの開発を行った。開発にあたっては,Web上での利用を想定し,HTML・JavaScript・Perlといった言語を使用した。記録システムは,一文字がタイプされるごとに,作文データをすべて記録するという機能を持っているため,データ量が多くなるという問題が発生したが,自然言語処理の専門家を交えて、記録データの整形を行うためのプログラムを別途開発した。 開発したシステムを用いて,日本人英語学習者20名から,作文データを収集した。テーマは,前述のとおり「学校教育」を設定し,1時間でのライティングタスクを実施した。収集したデータから,英文の産出過程を分析した結果,文頭の副詞と主語と動詞がひとまりで抽出されるなど,機械的に産出単位を抽出するn-gramモデルとは異なる産出単位・言語表現が観察された。なお,アラバマ大学で行われた国際シンポジウムにて,この成果を報告した。
|