研究概要 |
平成17年度には、80万語のコーパスを作成した。 アメリカの高校レベルで使用されている教科書11冊(化学、物理、数学など総合科学系の分野)を厳選し、全ページをスキャナーにかけOCRソフトを用いて電子ファイル化した。 平成18年度には、上記80万語のコーパスから、別冊の報告書に掲載する約10,000例の名詞句データベースを完成した。このデータベースは、アメリカの高校レベルで使用されている教科書11冊(化学、物理、数学など総合科学系の分野)を厳選し、全ページをスキャナーにかけOCRソフトを用いて電子ファイル化したものであり、これを元に、名詞句の抽出(教材として使いやすくするための修正を含む)を行った。 紙の印刷物をスキャナーにかけてデータを抽出する作業は、 1)どの部分を名詞句として判断し吸い上げるか、その基準作成 2)正しく文字として読み取れない、いわゆる「ゴミ」の処理 など、困難を極めた。 最終的には、当研究グループが作成に関わった「理工系学生のための必修英単語COCET3300」(成美堂)の見出し語を軸に、名詞句データ約1万例を抽出することができた。 またこの抽出作業と平行して、作成中の名詞句データを一部使用して「名詞句を探そう」及び「名詞句を作ろう」という自作E-learningソフト(htt://kameken.gifu-nct.ac.jp/ket/menu.aspx)に載せ、使用者と未使用者の英語力比較をした論文を発表した。(「高専生に必要な英語名詞後置修飾句の習得を目指したオンライン学習システム」)この論文は国立高専機構主催の平成18年度教育研究集会で文部科学大臣賞(教育部門)を受賞した。
|