2020 Fiscal Year Final Research Report
Automatic classification of images using machine learning to structure archaeological big data and enhance information retrieval
Project/Area Number |
19K21643
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 2:Literature, linguistics, and related fields
|
Research Institution | Nara National Research Institute for Cultural Properties |
Principal Investigator |
Takata Yuichi 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 研究員 (50708576)
|
Co-Investigator(Kenkyū-buntansha) |
野口 淳 独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, 客員研究員 (70308063)
|
Project Period (FY) |
2019-06-28 – 2021-03-31
|
Keywords | データベース / 考古学 / 画像認識 / ビッグデータ / 自動分類 / 機械学習 / 情報探索 |
Outline of Final Research Achievements |
In this research, we regard the vast information assets as "archaeological big data", and aim to improve their distributability and reusability by promoting their structuring through machine learning. In FY2019, we created teacher data from the digital data of reports, which are roughly classified into types such as drawings of artifacts and photographs of artifacts. In FY2020, the program and the teacher data were used to automatically extract 820,000 images from the PDF. From this set of images, 54 types of teacher data for each type of stone tool were created. By calculating the degree of similarity using machine learning, it is now possible to display similar images for each type of stone tool.
|
Free Research Field |
人文情報学
|
Academic Significance and Societal Importance of the Research Achievements |
考古学は蓄積型の学問である。これまでの調査研究によって膨大な文字情報と画像情報が蓄積されているが、標準化・構造化が進まず、情報の体系的な検索と再利用性に課題がある。本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上を図った。データ探索(データマイニング等)の基盤構築を目指した。主に報告書図面データを対象に機械学習にて類似度を算出し、石器種別ごとに類似画像を表示できるようになった。大量データから研究に有意な情報探索をできるようになった意義は大きい。
|