研究課題
挑戦的研究(萌芽)
考古学は蓄積型の学問である。これまでの調査研究によって膨大な文字情報と画像情報が蓄積されているが、標準化・構造化が進まず、情報の体系的な検索と再利用性に課題がある。本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上をはかる。さらにデータ探索(データマイニング等)の基盤構築を目指す。本研究によって過去の研究蓄積データの構造化を実現できれば、考古学研究の深化に貢献できる。参照される機会が少なかった資料の再評価につなげることも可能となる。
本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上をはかる。2019年度は、報告書デジタルデータから遺物図面・遺物写真等の種類に大別する教師データを作成した。その教師データをもとに機械学習による画像自動抽出プログラムで、報告書デジタルデータから類似画像を大量に抽出するテストプログラムを実装した。2020年度は、プログラムと教師データを活用し、PDFから82万件の画像を自動抽出した。その画像群からさらに石器の種別ごとの教師データ54種類を作成した。機械学習にて類似度を算出し、石器種別ごとに類似画像を表示できるようになった。
考古学は蓄積型の学問である。これまでの調査研究によって膨大な文字情報と画像情報が蓄積されているが、標準化・構造化が進まず、情報の体系的な検索と再利用性に課題がある。本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上を図った。データ探索(データマイニング等)の基盤構築を目指した。主に報告書図面データを対象に機械学習にて類似度を算出し、石器種別ごとに類似画像を表示できるようになった。大量データから研究に有意な情報探索をできるようになった意義は大きい。
すべて 2021 2020 2019 その他
すべて 雑誌論文 (3件) (うち国際共著 1件、 オープンアクセス 3件) 学会発表 (4件) 図書 (2件) 備考 (1件)
デジタル技術による文化財情報の記録と利活用3-著作権・文化財動画・GIS・三次元データ・電子公開-
巻: 3 号: 27 ページ: 153-156
http://sitereports.nabunken.go.jp/90271
奈良文化財研究所紀要
巻: 2020 ページ: 46-47
The ARIADNE Impact
ページ: 175-185
https://sitereports.nabunken.go.jp/ja