研究概要 |
今年度は,主に次の5テーマを重点的に推進した. 1. 英語参考書中の例文の電子化 昨年度に続き,中高で使われる英語参考書に含まれる例文の電子化を進めた.電子化の形式としては,例文とその当該例文が解説している文法項目に関する情報を付与した.現在,延べ6冊分の英語参考書を電子化し,1万文を超えている. 2. 文法情報の完備化 昨年度および1の電子化作業では,例文に付与される文法情報は部分的なものであり(当該例文が解説している文法項目のみ),他の文法項目に関する情報が付与されていない.文法項目の検出ルールの検証等には全ての文法項目に関する情報が備わったデータの整備が望まれる.そこで,2担当者(徳見・後藤)を中心に,2冊の英語参考書から電子花した例文に対して,全ての文法項目に関する情報を付与する作業を進めている.現在,約3,500文について終了しており(ダブルチェックは未),次年度も継続する予定である. 3. 英文法コーパスの公開方法の検討 今回構築を進めているコーパスの公開に際し,著作権等の問題のない公開方法について検討した。 4. 形態素情報に基づいた文法項目の検出ルールの記述 形態素解析を前提に品詞や原形といった形態素情報が付与された英文に対して,当該英文が含む文法情報を検出するルールの記述・蓄積を進めた.21の文法項目について検出ルールを記述し,その精度(適合率・近似的な再現率)を算出した.また記述が難しい文法項目については,その原因とどのようなレベルの情報があれば検出ができるのかを考察した. 5. 文法情報を活用した応用研究 学校英文法の文法項目の検出ルールを活用し,ESPコーパスからの特徴表現の抽出などの応用研究を行った.
|