研究課題/領域番号 |
20K20138
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分90020:図書館情報学および人文社会情報学関連
|
研究機関 | 国立歴史民俗博物館 |
研究代表者 |
橋本 雄太 国立歴史民俗博物館, 大学共同利用機関等の部局等, 准教授 (10802712)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | データ構造化 / データ駆動型研究 / マークアップ / エンティティリンキング / クラウドソーシング / 歴史資料 / データ駆動研究 / テキストアノテーション / ユーザー参加 / テキストレポジトリ / テキスト構造化 |
研究開始時の研究の概要 |
本研究の目的は、歴史資料を対象としたデータ駆動型研究の基盤の確立である。機械処理を駆使した歴史研究の遂行には、機械可読形式で提供される大量のテキストデータの存在が不可欠であるが、わが国は歴史資料のデジタルテキスト化について諸外国に大きな遅れを取っている。そこで本研究では、①文献資料に特化した軽量マークアップ言語の開発、②そのTEIとの互換性確立、③歴史資料テキストのユーザー参加型レポジトリ開設などを通じて、日本語の歴史文献を対象としたデータ駆動型研究に取り組むための環境を整備する。
|
研究成果の概要 |
本研究の目的は,日本語歴史資料テキストの共用レポジトリの構築を通じて,歴史資料を対象としたデータ駆動型研究の基盤を確立することであった.当初はテキスト構造化のためのマークアップ言語の開発に取り組む想定であったが,構造化の手法を①スタンドオフマークアップと②エンティティリンキングの2手法に切り替え,これに基づく歴史資料テキストの構造化のためのプラットフォーム構築に取り組んだ.その成果として「みんなでマークアップ【安政江戸地震】」(https://markup.honkoku.org/),またその改良版である「みんなで注釈」(https://ansei2.vercel.app/)を公開した.
|
研究成果の学術的意義や社会的意義 |
本研究は,わが国に大量に保存されている歴史資料を構造データ化し,データ駆動型研究の素材として提供するための基礎を構築する研究である.「みんなでマークアップ」および「みんなで注釈」では,実験的に1855年の安政江戸地震の記録史料を対象に構造化を実施しているが,災害被害を地図上に可視化し,計量的に処理することが可能になった.このシステムを他の史料群に適用することで,データサイエンス的手法を駆使した新しいアプローチの歴史研究が可能になることが期待される.
|