研究概要 |
本年度は,昨年度までの学校文法情報付き英文データ(広義の英文法コーパス)の構築そのものから,その有効性の検証や応用研究に緩やかに比重を移し,次の4つのテーマを推進した. 1.英文法参考書の英文の電子化と文法情報の完備化 プロジェクト開始当初から進めている,中高で使われる英語参考書に含まれる例文の電子化を行った.ただし,今年度は主に昨年度までに電子化した英文に対する文法情報のダブルチェックに注力し,全体的な質の向上と英文に対する文法情報の完備化に重点を置いた.そのなか新たな英文の電子化も進めており,蓄積数は1.5万文程度に達している. 2.公開方法の検討とそれに伴うプログラム等の整備 構築中の英文データの公開に関する著作権上の位置づけと問題点を議論し,公開方法を検討,決定した.また公開されたデータを取得したユーザが,本データを容易に再現できるよう,関連プログラムを作成,整備した. 3.n-gramのような部分表現からの文法項目検出 既にこの英文データを活用した文法項目を検出するためのルール整備が進められているが,前提としている言語単位は「文」であった.応用研究の中で,文に満たない句やn-gramといった断片的な表現から文法項目を検出する必要性が生じた.そこで,部分表現の構造情報等を復元し,該当する文法項目を検出する方法論を検討した. 4.文法情報付き英文データの有効性 英語学習における学校文法の位置づけとその重要性を,主に大学英語教育の立場から検討し,本データの有用性や応用可能性について論じた. なお,これらの英文データについて,従前,「(学校)英文法コーパス」と呼んでいるが,狭義の「コーパス」を考えた場合には不適当であることも懸念され,ここでは学校文法情報付き英文データ,もしくは広義の英文法コーパスと明示した.
|