• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

シーリー家書簡集のXMLコーパスの制作に基づく書記素、語彙の研究

研究課題

研究課題/領域番号 16520304
研究機関東京慈恵会医科大学

研究代表者

小原 平  東京慈恵会医科大学, 医学部, 助教授 (10266603)

研究分担者 園田 勝英  北海道大学, 言語文化部, 教授 (70113694)
キーワードthe Cely Letters / electric corpus / XML / TEI / digital images / Middle English / graphology
研究概要

小原の書記素レベルでのマニュスクリプト分析と、園田の語彙、文法構造レベルでの言語学的分析を合体させ、XMLフォーマットの電子コーパスを作る3年計画のプロジェクトの1年目。オランダ科学情報サービス協会のDr. Dalen-OskamとJoris van Zundertからの情報を得ながら、中世文献全般に使えるような標準的なXML Schemaの構築をめざす。具体的には、平成16年度は(1)小原、園田が分担してHanham版のThe Cely Lettersの全書簡をスキャナーとOCRソフトを用いてテキストファイル化した。(2)小原が、英国のLeedsにおける国際中世学会(IMC2004)において、Dalen-Oskam等と中世文献の電子テキスト化に関するシンポジウムを行い、参加した学者たちと意見の交換を行った。(3)小原、園田が、9月に約3週間英国のKewにあるthe Public Record Officeに赴き、そこで各書簡の画像ファイルの購入に従事した。(4)帰国後、画像ファイルのデジタルコピーを利用して、製作したテキストとの照合作業をできるかぎり行った。(この成果は、2005年度の5月に小原が米国のKalamazooでの国際中世研究学会においてthe Oxford Text Archiveが主催するシンポジウムにおいて発表する予定。)(5)XML化する際に、テキストをどのように分類していくか、どのようなタグ付けが適当であるかについて、小原、園田、Dalen-Oskamの間で、e-mail等を使った議論を行った。小原、園田は、4回ほどお互いの大学を訪問し、直接意見の交換を行った。この結果、TEIに準拠した方法でタグ付けをすることを、小原、園田の了解事項として、それぞれがファイルの試作を開始している。

  • 研究成果

    (1件)

すべて 2005

すべて 図書 (1件)

  • [図書] 英語コーパス言語学【改訂新版】-基礎と実践2005

    • 著者名/発表者名
      齊藤俊雄, 中村純作, 赤野一郎, 園田勝英, 他
    • 総ページ数
      325
    • 出版者
      研究社

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi