2009 Fiscal Year Annual Research Report
教材の自動評価のための学校文法に基づいた安全な英文解析システムの開発
Project/Area Number |
21720211
|
Research Institution | Ritsumeikan University |
Principal Investigator |
田中 省作 Ritsumeikan University, 文学部, 准教授 (00325549)
|
Keywords | 学校文法 / 科学文法 / 構文構造 / 機械学習 |
Research Abstract |
今年度は,申請時の研究計画に従い,次の2テーマを重点的に推進した. 1.学校文法上の項目と科学文法上の情報との対照調査 佐野らの学校文法上の項目を30程度に整理した学校文法上の項目と,科学文法の一つである句構造文法の文法的特徴(品詞/単語の混合列や部分的な構文構造など)との対応関係について調査した.その結果,約2/3の学校文法上の項目は,品詞/単語の混合列である程度同定できることが見込まれた.一方,残りの1/3程度については,多くが部分的な構文構造で同定できることが予想されたものの,その一部には構文レベルでも峻別が難しいもの(例えば,文型の4と5)も存在することも明らかとなった. 2.科学文法上の文法情報を活用した文法項目の同定アルゴリズムの開発 テーマ1の調査結果に基づき,本年度は特に品詞/単語の混合列で一定同定されることが予想された学校文法上の21文法項目について,文中でその使用の有無を検出するルール(検出ルール)を整備した.検出ルールは形態素レベル(品詞/単語の混合列)で記述され,それぞれについて別途整備を進めている学校英文法コーパス(文に対して使用されている学校文法の項目に関する情報が付与されている文例集)を使用して,その検出精度(Preclsionと疑似Recall)を与えた.また,形態素レベルで記述が難しいものについては,句構造文法の部分的な構文構造をベースとした検出ルールを効率的に記述するために,部分木を活用した機械学習理論を援用することを検討し,予備的調査・実験を行った.
|