研究課題/領域番号 |
19K21643
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分2:文学、言語学およびその関連分野
|
研究機関 | 独立行政法人国立文化財機構奈良文化財研究所 |
研究代表者 |
高田 祐一 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 研究員 (50708576)
|
研究分担者 |
野口 淳 独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, 客員研究員 (70308063)
|
研究期間 (年度) |
2019-06-28 – 2021-03-31
|
キーワード | データベース / 考古学 / 画像認識 / ビッグデータ / 自動分類 / 機械学習 / 情報探索 |
研究成果の概要 |
本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上をはかる。 2019年度は、報告書デジタルデータから遺物図面・遺物写真等の種類に大別する教師データを作成した。その教師データをもとに機械学習による画像自動抽出プログラムで、報告書デジタルデータから類似画像を大量に抽出するテストプログラムを実装した。2020年度は、プログラムと教師データを活用し、PDFから82万件の画像を自動抽出した。その画像群からさらに石器の種別ごとの教師データ54種類を作成した。機械学習にて類似度を算出し、石器種別ごとに類似画像を表示できるようになった。
|
自由記述の分野 |
人文情報学
|
研究成果の学術的意義や社会的意義 |
考古学は蓄積型の学問である。これまでの調査研究によって膨大な文字情報と画像情報が蓄積されているが、標準化・構造化が進まず、情報の体系的な検索と再利用性に課題がある。本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上を図った。データ探索(データマイニング等)の基盤構築を目指した。主に報告書図面データを対象に機械学習にて類似度を算出し、石器種別ごとに類似画像を表示できるようになった。大量データから研究に有意な情報探索をできるようになった意義は大きい。
|