2004 Fiscal Year Annual Research Report
Perlスクリプトによる英語通時構文解析コーパスの検索システムの開発及び分析
Project/Area Number |
16520305
|
Research Institution | Nihon University |
Principal Investigator |
保坂 道雄 日本大学, 国際関係学部, 助教授 (10229164)
|
Keywords | コーパス / 英語史 / 統語変化 / Perl / 文法タグ / 古英語 / 中英語 / 文法化 |
Research Abstract |
本年度の研究は、The Penn-Helsinki Parsed Corpus of Middle English第2版(1999年に完成した総語数約130万語の中英語構文解析コーパス)及び、The Brooklyn-Geneva-Amsterdam-Helsinki Parsed Corpus of Old English(2003年に完成した総語数約150万語の古英語構文解析コーパス)という2つの英語通時コーパスについて、各テキストファイルに付加されている文法タグの構成を確認し、特に代名詞の表記に関する項目を中心に分析を行った。その際、古英語及び中英語の原典と照合して、各テキストのサンプリングの有効性を検討した。また、実際のコーパス検索では、試験的にPerlスクリプトを利用した検索実行し、その可能性を探り、特にCorpusSearchや他の検索プログラムによる検索よりも、Perlスクリプトを用いた検索の方が、現在研究対象としている通時的統語研究に、より有効であることを確認した。 また、本年度行った研究成果の一部は、昨年11月の日本英語学会第22回大会のシンポジウム(『歴史言語学の新たな展開-文法化現象をめぐって』)における発表(『文法化と適応的進化』)の中で、古英語及び中英語の再帰代名詞形の発達の検証という形で公表している。 なお、本年2月に初期近代英語テキストに文法タグを付加した総語数約180万語のPenn-Helsinki Parsed Corpus of Early Modern Englishが公開になった。来年度はこのコーパスを含めて、古英語・中英語・初期近代英語の3つの時代を対象とした通時的研究を行う予定である。
|