研究課題/領域番号 |
19K20626
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | IIIF / TEI / RDF / OCR / Omeka / 人文情報学 / デジタルアーカイブ / 翻刻 / くずし字OCR / 編集距離 / 源氏物語 / VSCode / くずし字 |
研究開始時の研究の概要 |
本研究の目的は、オンライン上で複数のユーザが共同で史料を翻刻可能なシステムを開発することである。特に、IIIFやTEI等の国際標準規格に準拠することにより、汎用的・国際的に利用可能なシステムの構築を目指す。具体的には、IIIF準拠の画像を入力データとして、IIIF準拠で公開されている様々な史料を翻刻対象として登録可能とする。また、システムに登録されたテキストデータをTEI準拠の形式でエクスポートする機能を提供し、テキストデータの長期保存およびシステムに依存しない多様な利活用を支援する。さらに、東京大学柏図書館が所蔵する『平賀譲文書』を対象とした翻刻作業を実施し、システムの利用可能性を示す。
|
研究成果の概要 |
本研究の目的は、オンライン上で複数の利用者が協力して史料を翻刻可能なシステムを開発することである。特に、画像共有のための国際標準であるIIIFや、人文学資料向けの構造化ルールを定めるTEI等の国際規格に適合させることで、幅広い用途・国際的に活用可能なシステムを構築した。本システムを用いて、画像と多様なテキストデータを関連付け、「源氏物語」の本文研究支援を目指すウェブサイト「デジタル源氏物語」を公開した。更に、くずし字OCRと編集距離を活用し、テキストデータが類似する写本・版本の画像を自動推薦する機能を提供する「デジタル源氏物語(AI画像検索版)」の公開も行った。
|
研究成果の学術的意義や社会的意義 |
本研究はIIIFおよびTEIなどの国際規格に準拠した、オンライン上での史料翻刻システムの開発により、人文情報学分野の発展に寄与した。また多様なテキストデータと画像を統合することで、「デジタル源氏物語」ウェブサイトの公開など、学術研究基盤の強化に貢献した。さらにくずし字OCRの利用、およびテキストデータが類似する写本・版本の画像を自動的に推奨する機能の組み合わせにより、歴史資料の新しい活用方法を提案した。デジタルアーカイブ学会と情報処理学会から評価されたこれらの取り組みは、歴史資料へのアクセスを容易とし、国際的な学術研究を促進する。
|