研究課題/領域番号 |
21K18014
|
研究機関 | 東京大学 |
研究代表者 |
中村 覚 東京大学, 史料編纂所, 助教 (80802743)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 相互運用性 / 長期保存 / デジタルアーカイブ |
研究実績の概要 |
今年度は静的サイトとしてデジタルアーカイブシステムを構築する手法を検討し、基盤となるシステム開発を行なった。具体的には、オープンソースWebアプリケーションフレームワークであるNuxt.jsを用いたシステム開発を行なった。CSVファイルの形式で用意した画像やメタデータに関する情報を読み込み、静的なウェブサイトを自動的に構築する。
また上記システムを用いて、以下に示すデジタルアーカイブシステムを構築した。いずれも静的サイトとして構築し、GitHubなどのホスティングサービス上で公開している。 渋沢栄一記念財団「渋沢栄一ダイアリー」/東洋文庫「『大正新脩大蔵経』底本・校本データベース」「酉蓮社(旧増上寺報恩蔵)蔵嘉興版大蔵経目録データベース」「東洋文庫水経注図データベース」/東京大学史料編纂所「正保琉球国絵図デジタルアーカイブ」「倭寇図巻デジタルアーカイブ」/国立歴史民俗博物館「デジタル延喜式」
上記において、特に「正保琉球国絵図デジタルアーカイブ」「倭寇図巻デジタルアーカイブ」については、IIIFを用いた画像公開についても静的サイトで実現している。具体的には、IIIF Image API Level 0を採用し、事前にタイル画像を生成しておくことで、サーバレスなIIIF対応を行なっている。また、人間のためのユーザインタフェースに加えて、機械処理に適したデータセットを提供することで、計算機による二次利用も支援する。具体的な活用事例として、Google Dataset Searchとの連携を実現している。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度は基盤となるシステム構築を行うことを予定していたが、実際には複数のシステム構築事例への適用までを2021度中に行うことができた。このデジタルアーカイブシステムの構築事例への適用を通じて、基盤システムに求められる機能も明らかになった。特に、渋沢栄一記念財団「渋沢栄一ダイアリー」と国立歴史民俗博物館「デジタル延喜式」については、TEI/XML(Text Encoding Intiative:人文科学のテキストの符号化・交換のための規格)によってマスタデータが管理・提供されたため、TEI/XMLファイルを入力とするデータ作成フローの検討を追加した。 また作成したデジタルアーカイブシステムのデータ活用フローとして、Google Dataset Searchとの連携や、Leafletや古地図ビューアライブラリであるMaplatとの連携も実現および検討した。後者の地図との連携については、いずれのツールも静的サイトとして構築することができ、本研究で提案するシステムの親和性も高いことを確認した。 これらの観点から、本研究課題を順調に進めることができた。
|
今後の研究の推進方策 |
デジタルアーカイブシステムの改良と構築事例への適用を継続して行う。また開発したシステムに関するドキュメンテーションを強化する。これにより、申請者以外によるシステムの導入と運用を支援する。 開発および改良予定の機能として、まず外部システムとの連携機能が挙げられる。JSON-LDやIIIFマニフェストファイルの配信に加えて、簡易なOAI-PMH(インターネット上のメタデータ自動収集のためのプロトコル)機能などの実装を検討する。また作成したデータの長期保存を目的として、OAIS参照モデル等に準拠したアーカイブ機能の構築も予定している。公開用のメタデータに加えて、保存用のメタデータ(METS、 MODS、 PREMISなど)を付与し、データの長期保存を支援する。 ドキュメンテーションに関しては、HugoやGatsbyといったドキュメント・マニュアル生成に適した静的サイトジェネレータを使用し、GitHub等のホスティングサービスで公開する。このドキュメンテーションの作成方法についても、第三者が参照・参画可能な形で環境構築を行う予定である。
|