研究概要 |
本年度は主に次のような検討を行った. 1.コーパス・デザイン(文法項目の精選) 学校英文法コーパスで取り扱う文法項目について,学習指導要領・検定教科書・参考書と従来研究を精査し,約30項目に整理し,学校英文法の基礎的なコーパス・デザインを与えた。 2.英語参考書中の例文の電子化 中高で使われる英語参考書に含まれる例文を電子化し,1.で選定した文法情報の付与を進めた(来年度も継続予定).参考書の例文は特定の学習トピックに焦点をあてたもので,文が単純化されたり,恣意的であったりして,文の自然さの観点では問題があるかもしれないが,特定の文法項目の構造を見出すには良い.現在電子化された例文は5,000文程度で,著作権等の問題に留意した上で,分析した品詞や構文に関する情報を今後公開することを予定している. 3.中学検定済み教科書に対する文法情報の付与 平成14年度検定済み中学教科書のうち,採択率が高いNew Crown, New Horizon, Sunshineの本文に対して,1,で選定した文法情報を付与した.日本の英語教科書に対して,語彙的観点からの分析は出揃いつつあり,今後,このデータを活用した文法的観点からの分析が期待される. 4.構文解析済みコーパスへの文法情報の付与 代表的な構文解析済み英文コーパスの一つであるPenn Treebankの一部(Brown Corpus部分)5,000文強に,比較的広い構文情報によって同定されるであろう文法項目として仮定法・分詞構文などの文法情報を付与した.後述する文法項目の検出ルールの自動記述の予備データとして活用した. 5.機械学習を活用した文法項目の検出 4.のデータを活用し,部分的な構文構造から文法項目を自動検出することを試みた.仮定法では適合率93.2%・再現率73.3%,分詞構文では適合率61.4%・再現率53,9%の精度が得られ,有効性と問題点を明らかにした.
|