研究課題
考古学は蓄積型の学問であり、発掘調査報告書(以下、報告書) は、重要な基礎資料である。しかし、報告書は戦前含めて膨大にあるため、過去の蓄積に適切にアクセスしにくいという課題がある。そして考古学においては、遺構・遺物そのものが研究対象であるため、画像情報(図面・写真)が重要である。本研究は、報告書に掲載された膨大な画像にアクセスするための画像認識技術の適用である。報告書の電子公開は主にPDFファイルによって実現されている。PDFファイルは、印刷物のレイアウトを継承したまま電子化できるなどメリットが多い。人間可読性は高いが 、データ自体は構造化されていないため、機械可読性は低い。特に、印刷物をスキャンし、デジタルデータ化したPDFからの必要な画像抽出は難しかった。解決のためには機械学習による画像自動抽出プログラムと分類するための教師データが必要である。2020年度は、2019年度のプログラムと教師データを活用し、PDFから82万件の画像を自動抽出した。その画像群からさらに石器の種別ごとの教師データ54種類を作成し機械学習にて類似度を算出した。数値が高い種別ほど類似していることを示す。この工程によって石器種別ごとに分類できたことになる。また当該画像に類似している画像を表示させる機能も開発した。おおむね類似している画像を表示させることに成功した。しかし、一部関係のない画像も混入しており、精度の向上の余地は残る。
すべて 2021 2020 その他
すべて 雑誌論文 (2件) (うちオープンアクセス 2件) 学会発表 (4件) 図書 (1件) 備考 (1件)
デジタル技術による文化財情報の記録と利活用3-著作権・文化財動画・GIS・三次元データ・電子公開-
巻: 3 ページ: 153-156
10.24484/sitereports.90271
奈良文化財研究所紀要
巻: 2020 ページ: 46-47
https://sitereports.nabunken.go.jp/ja