2004 Fiscal Year Annual Research Report
シーリー家書簡集のXMLコーパスの制作に基づく書記素、語彙の研究
Project/Area Number |
16520304
|
Research Institution | Jikei University School of Medicine |
Principal Investigator |
小原 平 東京慈恵会医科大学, 医学部, 助教授 (10266603)
|
Co-Investigator(Kenkyū-buntansha) |
園田 勝英 北海道大学, 言語文化部, 教授 (70113694)
|
Keywords | the Cely Letters / electric corpus / XML / TEI / digital images / Middle English / graphology |
Research Abstract |
小原の書記素レベルでのマニュスクリプト分析と、園田の語彙、文法構造レベルでの言語学的分析を合体させ、XMLフォーマットの電子コーパスを作る3年計画のプロジェクトの1年目。オランダ科学情報サービス協会のDr. Dalen-OskamとJoris van Zundertからの情報を得ながら、中世文献全般に使えるような標準的なXML Schemaの構築をめざす。具体的には、平成16年度は(1)小原、園田が分担してHanham版のThe Cely Lettersの全書簡をスキャナーとOCRソフトを用いてテキストファイル化した。(2)小原が、英国のLeedsにおける国際中世学会(IMC2004)において、Dalen-Oskam等と中世文献の電子テキスト化に関するシンポジウムを行い、参加した学者たちと意見の交換を行った。(3)小原、園田が、9月に約3週間英国のKewにあるthe Public Record Officeに赴き、そこで各書簡の画像ファイルの購入に従事した。(4)帰国後、画像ファイルのデジタルコピーを利用して、製作したテキストとの照合作業をできるかぎり行った。(この成果は、2005年度の5月に小原が米国のKalamazooでの国際中世研究学会においてthe Oxford Text Archiveが主催するシンポジウムにおいて発表する予定。)(5)XML化する際に、テキストをどのように分類していくか、どのようなタグ付けが適当であるかについて、小原、園田、Dalen-Oskamの間で、e-mail等を使った議論を行った。小原、園田は、4回ほどお互いの大学を訪問し、直接意見の交換を行った。この結果、TEIに準拠した方法でタグ付けをすることを、小原、園田の了解事項として、それぞれがファイルの試作を開始している。
|
Research Products
(1 results)