研究概要 |
3カ年計画の2年目にあたる本年度は、初年度に電子テキスト化した、非英語圏の英語学習者向けのgraded readersの読み取りデータの修正作業を引き続き行いながら、新たに英語圏の児童を対象としたleveled readersのコーパスの作成を開始した。Graded readersについては、これまでに主要4大シリーズであるCambridge English Readers(64 冊),Oxford Bookworms Library(175冊)、Penguin Readers(359冊中300冊),Macmillan Readers(143冊中132冊)の本文読み取りデータの修正が終了し、品詞タガーやコンコーダンサにかける前に必要な、行末のハイフンの処理などのテキストの編集・整形を行っているところである。Leveled readersについては、Oxford Reading Tree(172冊),Longman Literacy Land Story Street(123冊),Longman Literacy Land Info Trail(90冊中78冊)、Houghton Mifflin Leveled Readers(354冊中135冊)について、人手による入力と、スキャナー・OCRソフトを使っての作業を併用して電子テキスト化まで終了した。全文を人手で確認するため、当初の予定よりも多くの作業時間がかかる状況が続いている。英語教育におけるgraded readersの利用が広がりを見せているが、各シリーズに関する詳しい情報が提供されているわけではないため、指導の際に参考にできるデータが欲しいというニーズが生まれている。作成中のコーパスが完成し、使用語彙や句動詞等についてのデータを公表することができれば、こうした英語教育界の要請に応えられる。
|