(1) 前年度に作成した試作コーパスを用いて、綴り、前置詞、否定辞、語順の調査を行なった。綴りについては、各書記ごとの特徴を分析した。前置詞についてはofの分布に関して興味ある観察が行なわれた。試作コーパスはこの点で満足の行く結果を出した。 (2) コーパスを用いる英語史研究一般についての考察を行なった。 (3) 近年公開されたPenn‐Helsinki Parsed Corpus of Middle English(PHPCME)のタグセットの目標は、試作コーパス用のタグセットの目標の一部となっている。PHPCMEのタグセットは統語構造の情報のみを扱うものである。このPHPCMEのタグセットの検討を詳細に行なった。動詞の移動、接続詞などについては、簡略に過ぎるが、インデックスの使用、補文の扱いについては優れていることが判明した。また、PHPCMEの配布はネットワークを用いて行なわれていて、検索ソフトも一緒に配布されている。タグセットの提案の形態として大変参考になることがわかった。 (4) タグ付けの自動化の研究の一部として、形態素解析ソフトウェアのPC‐KIMMOを検討した。PC‐KIMMOを実際に現代英語のテキストに用いて、その結果を語彙表の研究に応用した。歴史的コーパスのタグ付けには、現在のとこと有用でないことが判明した。 (5) 報告書の作成を行なった。
|