• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

Automatic classification of images using machine learning to structure archaeological big data and enhance information retrieval

Research Project

Project/Area Number 19K21643
Research InstitutionNara National Research Institute for Cultural Properties

Principal Investigator

高田 祐一  独立行政法人国立文化財機構奈良文化財研究所, 企画調整部, 研究員 (50708576)

Co-Investigator(Kenkyū-buntansha) 野口 淳  独立行政法人国立文化財機構奈良文化財研究所, 埋蔵文化財センター, 客員研究員 (70308063)
Project Period (FY) 2019-06-28 – 2021-03-31
Keywords考古学 / データベース / 機械学習 / 画像認識 / 画像 / 電子公開
Outline of Annual Research Achievements

考古学は蓄積型の学問であり、発掘調査報告書(以下、報告書) は、重要な基礎資料である。しかし、報告書は戦前含めて膨大にあるため、過去の蓄積に適切にアクセスしにくいという課題がある。そして考古学においては、遺構・遺物そのものが研究対象であるため、画像情報(図面・写真)が重要である。本研究は、報告書に掲載された膨大な画像にアクセスするための画像認識技術の適用である。
報告書の電子公開は主にPDFファイルによって実現されている。PDFファイルは、印刷物のレイアウトを継承したまま電子化できるなどメリットが多い。人間可読性は高いが 、データ自体は構造化されていないため、機械可読性は低い。特に、印刷物をスキャンし、デジタルデータ化したPDFからの必要な画像抽出は難しかった。解決のためには機械学習による画像自動抽出プログラムと分類するための教師データが必要である。
2020年度は、2019年度のプログラムと教師データを活用し、PDFから82万件の画像を自動抽出した。その画像群からさらに石器の種別ごとの教師データ54種類を作成し機械学習にて類似度を算出した。数値が高い種別ほど類似していることを示す。この工程によって石器種別ごとに分類できたことになる。また当該画像に類似している画像を表示させる機能も開発した。おおむね類似している画像を表示させることに成功した。しかし、一部関係のない画像も混入しており、精度の向上の余地は残る。

  • Research Products

    (8 results)

All 2021 2020 Other

All Journal Article (2 results) (of which Open Access: 2 results) Presentation (4 results) Book (1 results) Remarks (1 results)

  • [Journal Article] 2020年度数字で見る全国遺跡報告総覧2021

    • Author(s)
      高田祐一
    • Journal Title

      デジタル技術による文化財情報の記録と利活用3-著作権・文化財動画・GIS・三次元データ・電子公開-

      Volume: 3 Pages: 153-156

    • DOI

      10.24484/sitereports.90271

    • Open Access
  • [Journal Article] 画像認識技術の文化財データへの適用実験2020

    • Author(s)
      高田祐一 , 野口淳
    • Journal Title

      奈良文化財研究所紀要

      Volume: 2020 Pages: 46-47

    • Open Access
  • [Presentation] 文化財情報発信の現状と課題 ―日本全国の文化財オープンデータ調査から考察する―2021

    • Author(s)
      武内樹治, 高田祐一
    • Organizer
      日本情報考古学会
  • [Presentation] 考古・埋蔵文化財空間データの可能性2021

    • Author(s)
      野口 淳, 高田祐一
    • Organizer
      日本情報考古学会
  • [Presentation] 文化財と著作権・所有権2020

    • Author(s)
      高田祐一
    • Organizer
      考古学・文化財のためのデータサイエンス・サロン
  • [Presentation] 考古学・文化財資料3D計測の意義を考える 知的財産権・著作権の観点から2020

    • Author(s)
      高田祐一
    • Organizer
      考古形態測定学研究会
  • [Book] デジタル技術による文化財情報の記録と利活用3-著作権・文化財動画・GIS・三次元データ・電子公開-2021

    • Author(s)
      高田 祐一 , 矢内 一正 , 福島 幸宏 , 呉 修喆 , 扈 素妍 , 武内 樹治 , 国武 貞克 , 芝 康次郎 , 小久保 拓也 , 味噌井 拓志 , 野口 淳 , 諫早 直人 , 大森 穂乃香 , 中村 魁 , 加藤 俊吾 , 木村 龍生 , 三好 清超 , 仲林 篤史 , 大橋 雅也 , 今井 隆博 , 菅野 智則 , 松田 直則 , 山﨑 孝盛
    • Total Pages
      160
    • Publisher
      奈良文化財研究所
  • [Remarks] 全国遺跡報告総覧

    • URL

      https://sitereports.nabunken.go.jp/ja

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi