研究課題/領域番号 |
19H01141
|
研究機関 | 国立情報学研究所 |
研究代表者 |
北本 朝展 国立情報学研究所, コンテンツ科学研究系, 教授 (00300707)
|
研究分担者 |
橋本 雄太 国立歴史民俗博物館, 大学共同利用機関等の部局等, 助教 (10802712)
加納 靖之 東京大学, 地震研究所, 准教授 (30447940)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 歴史ビッグデータ / データ構造化 / 統合解析 / データ駆動型復元 / 研究基盤 / 機械学習 / 歴史GIS / IIIF |
研究実績の概要 |
本研究は「歴史ビッグデータの構造化ワークフロー」を中心に研究を進め、これまでに扱った具体的なユースケースを基に、ワークフローをより抽象化した形で定式化することを目指した。その結果、当初の想定である「非構造化データから構造化データへと一方向に進むワークフロー」は実際のニーズと合わない部分があり、むしろ「文書空間と実体空間の識別子を双方向的に結合するワークフロー」が必要であるとの考えに至った。文書を読む研究者は文書空間に焦点を合わせるが、実世界の出来事(例えば古地震や古気候)をデータ駆動で復元する研究者は実体空間から出発する。この視点の違いによるギャップを乗り越えることが、歴史ビッグデータの重要な課題であるとの発見を得た。そこで、このギャップを乗り越えるための研究を進めた。 1. 江戸データポータル「edomi」では、すでに構築したテーマごとの構造化データ「江戸マップβ版」、「武鑑全集」、「江戸買物案内」、「江戸観光案内」、「歴史地名マップ」を対象に、実体空間の地名識別子「GeoLOD」を用いて文書空間中の様々な資料を統合した。 2. 歴史ビッグデータを構築するツールの一つであるIIIF Curation Platformについては、「江戸買物案内」や「江戸観光案内」などを対象に、歴史ビッグデータの構造化ワークフローに合わせた改良を行った。 3. 「武鑑全集」では、異なる時点に出版された木版本を比較し、同一木版の画像を比較して差分を強調するツールvdiff.jsの開発や「差読プラットフォーム」の構築を進めた。またツールを用いた差分翻刻により、長期時系列の構造化データが効率的に構築できることを示した。 4. 今後の展開に向けて、多分野の歴史ビッグデータを統合解析する情報基盤である「れきろく」の概念設計を進めた。 以上の成果により、歴史ビッグデータ研究基盤のプロトタイプが実現できた。
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|