2022 Fiscal Year Annual Research Report
Verification of Sueki potteries' types and dating criteria by deep learning cluster analyses of 3D-RGB data
Project/Area Number |
22H00744
|
Allocation Type | Single-year Grants |
Research Institution | Niigata University of International and Information Studies |
Principal Investigator |
藤田 晴啓 新潟国際情報大学, 経営情報学部, 教授 (40366513)
|
Co-Investigator(Kenkyū-buntansha) |
河原 和好 新潟国際情報大学, 経営情報学部, 准教授 (20319023)
山本 亮 独立行政法人国立文化財機構東京国立博物館, 学芸研究部, 研究員 (30770193)
宮尾 亨 新潟県立歴史博物館, その他部局等, 研究員 (90245655)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 須恵器 / 深層クラスター解析 / 型式・年代分類 / ヒト判断根拠の検証 / ボクセルデータ / 数理考古学 / 3D-RGBAデータ / 光学スキャナー |
Outline of Annual Research Achievements |
東京国立博物館所蔵6世紀の完形・略完形須恵器坏の蓋49点および身59点を光学スキャナー解像度0.5mmにて計測を行った。スキャン後にメッシュ出力されたデータを128*128*128解像度Voxelデータに変換した。解析に供試されたデータセットは3D-RGBA(色情報あり)および3D-A(色情報なし形状のみ)の2種類である。それぞれのデータを疑似ラベル教師付き分類+深層クラスターモデルにより6クラスターを出力した。須恵器身の型式データによるクラスター散布図では、ふたつのデータセットでは須恵器編年を大系化した中村浩氏の型式Ⅱ-4およびⅡ-5から成るクラスターがヒト分類と共通するクラスターとして顕著に検出された。導出されたクラスターおよび専門家の型式・年代分類とのクラスター行列では、上記の散布図で確認されたクラスター(クラスター行列ではID-3)における専門家型式分類構成も一致した。その他のクラスターと専門家型式分類の間には明瞭な関係がなく大きな乖離があった。須恵器身の年代解析でも専門家年代分類後葉およびクラスターID-3マッチングよく、それ以外は乖離し、ひとつのクラスター意外に顕著な関連は発見できなかった。 須恵器3Dおよび3方向の2Dデータから形式と年代を同時に出力するCNNモデルを構築し上記専門家の型式・年代ラベルを正解として学習させた分類モデルでは、Voxel解像度を64から128にあげたところ全クラスの平均正解率および再現率が向上した。分類クラスにおける不均衡を少数派のデータクラスに対し損失関数に重み付けを行うことによって,それらが誤分類されたときの損失が大きくなるよう調整する(Weighted Loss Function)ことにより、解決を試みた。これにより、型式の正解率は約58.7%、年代については約71.2%と向上した。 また縄文土器のクラスター解析も開始した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本科研チームでは須恵器等土器のスキャナー計測を行う考古学者と、モデルデザインを行うデータサイエンティスト、さらにモデル構築と解析を実行するプログラマーと3分野に分業しているため非常に効率的に研究が進められる。特に今年度は同様の須恵器データセットを用いながら、深層クラスター解析を研究代表者である藤田と解析チーム、教師付き学習分類を研究分担者である山本と解析チームが独立して研究したため、大きな進展があった。 また、複数の研究費制度による共用設備の購入(合算使用)を利用して当該科研費以外の科研費を合算してNVIDIA GDX Station A100 512GB/320GB GPU AI計算機を導入し、本研究および上記の科研チームが関わる計算処理を専用で使用し、計算機資源が非常に効率よいことも研究の進展に寄与している。 クラスター解析に関する比較を実施するため、縄文土器もスキャナー計測を行ったが、須恵器と比較して大きさや紋様、デザインに多様性があるので、須恵器ほど有意な結果が出ていない。これはサンプル数を大幅に増やす必要があると考えられる。
|
Strategy for Future Research Activity |
これまでのところ、k-means法を用いたクラスター解析では専門家の分類基準と大きな乖離がみられ、その原因を追求する。クラスターの大きさが不均一でも対応可能、かつメモリ効率が良好なクラスタリング手法として、Topological Mode Analysis Tool(ToMATo)の利用を検討する。個体差が大きい(外れ値の)須恵器, 複数の型式・年代の特徴を併せ持つ須恵器が存在する可能性も考えられるためである。外れ値に関しては, DBSCANやOPTICSなどの外れ値を扱えるクラスタリングアルゴリズム, 複数のクラスタを割当て可能なFuzzy c-meansなどファジイクラスタリングアルゴリズムの適用を検討している。 今回の解析で明らかになった課題は, voxelデータで須恵器を再構築(再現)した場合, 現行のvoxel化の手法では実寸・法量が反映されていない問題である。解決策としては前述VXelementsアプリケーションで法量・寸法をエンティティデータとして汎用フォーマット(igs,stp,csv等)にて出力し, それをvoxelデータに反映させる方法がある。具体的には, 例えばvoxelの単位を1mm立方体として固定定義し, エンティティデータから須恵器を1mm立法体voxelとして再構築する方法である。 現在の解析では東京国立博物館所蔵の完形・略完形の須恵器を対象としているため, サンプル数が蓋で49, 身で59と数理・データサイエンスの解析用としては非常に少ない問題がある。 今後は各地の窯跡の良好な資料のデータを収集したいと考えるが, 往々にして窯跡資料は欠損や歪みが大きい資料が多い。そのため窯跡に限らず, 古墳や集落遺跡から出土した, 完形かつ歪みが少ない良好な資料についても分類の基準となるデータ(教師データ)として収集したいと考えている。
|