Automatic classification of images using machine learning to structure archaeological big data and enhance information retrieval
Project/Area Number |
19K21643
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 2:Literature, linguistics, and related fields
|
Research Institution | Nara National Research Institute for Cultural Properties |
Principal Investigator |
Takata Yuichi 独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 研究員 (50708576)
|
Co-Investigator(Kenkyū-buntansha) |
野口 淳 独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, 客員研究員 (70308063)
|
Project Period (FY) |
2019-06-28 – 2021-03-31
|
Project Status |
Completed (Fiscal Year 2020)
|
Budget Amount *help |
¥5,720,000 (Direct Cost: ¥4,400,000、Indirect Cost: ¥1,320,000)
Fiscal Year 2020: ¥2,990,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥690,000)
Fiscal Year 2019: ¥2,730,000 (Direct Cost: ¥2,100,000、Indirect Cost: ¥630,000)
|
Keywords | データベース / 考古学 / 画像認識 / ビッグデータ / 自動分類 / 機械学習 / 情報探索 / 画像 / 電子公開 / 考古学ビッグデータ / 発掘調査報告書 / 文化財 / 歴史ビッグデータ |
Outline of Research at the Start |
考古学は蓄積型の学問である。これまでの調査研究によって膨大な文字情報と画像情報が蓄積されているが、標準化・構造化が進まず、情報の体系的な検索と再利用性に課題がある。本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上をはかる。さらにデータ探索(データマイニング等)の基盤構築を目指す。本研究によって過去の研究蓄積データの構造化を実現できれば、考古学研究の深化に貢献できる。参照される機会が少なかった資料の再評価につなげることも可能となる。
|
Outline of Final Research Achievements |
In this research, we regard the vast information assets as "archaeological big data", and aim to improve their distributability and reusability by promoting their structuring through machine learning. In FY2019, we created teacher data from the digital data of reports, which are roughly classified into types such as drawings of artifacts and photographs of artifacts. In FY2020, the program and the teacher data were used to automatically extract 820,000 images from the PDF. From this set of images, 54 types of teacher data for each type of stone tool were created. By calculating the degree of similarity using machine learning, it is now possible to display similar images for each type of stone tool.
|
Academic Significance and Societal Importance of the Research Achievements |
考古学は蓄積型の学問である。これまでの調査研究によって膨大な文字情報と画像情報が蓄積されているが、標準化・構造化が進まず、情報の体系的な検索と再利用性に課題がある。本研究では、膨大な情報資産を「考古学ビッグデータ」と捉え、機械学習により構造化を進めることにより流通性と再利用性の向上を図った。データ探索(データマイニング等)の基盤構築を目指した。主に報告書図面データを対象に機械学習にて類似度を算出し、石器種別ごとに類似画像を表示できるようになった。大量データから研究に有意な情報探索をできるようになった意義は大きい。
|
Report
(3 results)
Research Products
(10 results)
-
-
-
-
-
-
-
-
[Book] デジタル技術による文化財情報の記録と利活用3-著作権・文化財動画・GIS・三次元データ・電子公開-2021
Author(s)
高田 祐一 , 矢内 一正 , 福島 幸宏 , 呉 修喆 , 扈 素妍 , 武内 樹治 , 国武 貞克 , 芝 康次郎 , 小久保 拓也 , 味噌井 拓志 , 野口 淳 , 諫早 直人 , 大森 穂乃香 , 中村 魁 , 加藤 俊吾 , 木村 龍生 , 三好 清超 , 仲林 篤史 , 大橋 雅也 , 今井 隆博 , 菅野 智則 , 松田 直則 , 山﨑 孝盛
Total Pages
160
Publisher
奈良文化財研究所
Related Report
-
-