研究概要 |
本年度は,学校文法情報付き英文データ(申請時の「学校英文法コーパス」で,学習参考書の例文を電子化し適宜情報を付与したものを「学校英文法の学参例文データベース」とよぶ)の応用研究と成果物の情報発信に比重を移し,推進した. 1.文法項目の検出ルールの整備と活用 文中に含まれる学校英文法の項目とその根拠となる箇所を検出するようなルールを整備し,次項目に記すような応用研究を進めた.文法項目の検出ルールは,学校英文法の学参例文データベースをもとに,作業者の内省と機械学習を組み合わせつつ,記述した.学参例文は,それが解説対象としている特定の文法項目に関する言語特徴が顕在化するよう単純化されており,その性質が検出対象とする文法項目の言語特徴を比較的少ない学習データ数でも記述されたと考えている.また,対象とする文法項目が多いということもあり,すべての文法項目について即時に高精度で実現することは難しい.そこで,ここでは事前に検出ルールの精度を見積もり,その精度を活用し補正することとした. 2.文法項目の検出ルール(学校英文法に基づいた英文解析)を用いた応用研究 別プロジェクトで構築した表現上の質情報を付した英語科学論文に対して,1で整備した検出ルールを適用し,質と文法項目に対する基礎的調査を幾通りか行った.その結果,従来から指摘されているような言語特徴が確認された.また,質判定という問題で考えた際には,元々,言語断片から学校文法への翻訳を意図した文法項目の多寡よりは,談話標識やn-gramといったものの方が相当に優位で,それはおおむね予想通りであった. 3.学参例文データベースの公開 昨年度策定した方式に従い,情報付与が中途で終わっていない学参例文の文法情報の公開を進めた.著作権上の問題から例文そのものは利用者が整備する必要があり,この文法情報と合併するプログラムもあわせて開発した.
|