昨年に引き続き、テキストのXMLフォーマットでの書き込みを継続。2002年4月の英語コーパス学会で作業の経過を報告し、電子コーパスとしてのXMLの持つ可能性と課題について述べた。XMLはタグ名を自由につけられることから、相互利用という点で障害が出てくる。早い時期の標準化が必要であり、ここではthe Cely Lettersやthe Stonor Letters等も含めた中世書簡集コーパス全般に付けることが可能なタグ名の試案を公開して、その共通利用を提案した。この内容は2003年3月発行予定の『英語コーパス研究』10号に掲載される。また昨年までに購入したthe Paston Lettersのマイクロフィルムを画像ファイル化し、コーパスへのリンク化を図った。さらにこの画像を利用してくs>とくw>に関するallographsの分析を行い、XMLファイルへのタグ付けを行った。この作業から得られたデータに、さらにいくつかの書記素の分析結果を加えて、2003年5月の日本英文学会で報告する。ここでは書き手の違いの割り出し作業を検証する。コーパス全体のXML化は完了したが、タグの追加を検討しており、その結果を同年7月のLeeds大学でのIMC大会でThe Paston Letters in XML -A new style for the electronic medieval textというセッションを主催し、報告する。ここではXMLコーパスの有用性を実証することを目標に掲げ、具体例としてthe Paston Lettersを取り上げ、文字と文法の2つの側面から得られるデータをもとに言語学的な分析を加え、その結果を発表する。
|