本年度の成果は、80万語のコーパス作成である。 アメリカの高校レベルで使用されている教科書11冊(化学、物理、数学など総合科学系の分野)を厳選し、全ページをスキャナーにかけOCRソフトを用いて電子ファイル化した。 このデータベースを元に、来年度は名詞句の抽出・分析に取りかかる。その下準備が完了した。 副産物としては、平成18年4月に出版された「COCET3300:理工系学生のための必修英単語3300」(成美堂)に掲載されている3300の例文作成作業において上記コーパスを大いに活用することができた。
|