研究課題/領域番号 |
22H00744
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分03060:文化財科学関連
|
研究機関 | 新潟国際情報大学 |
研究代表者 |
藤田 晴啓 新潟国際情報大学, 経営情報学部, 教授 (40366513)
|
研究分担者 |
河原 和好 新潟国際情報大学, 経営情報学部, 准教授 (20319023)
山本 亮 独立行政法人国立文化財機構東京国立博物館, 学芸研究部, 研究員 (30770193)
宮尾 亨 新潟県立歴史博物館, その他部局等, 研究員 (90245655)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
17,810千円 (直接経費: 13,700千円、間接経費: 4,110千円)
2023年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2022年度: 11,700千円 (直接経費: 9,000千円、間接経費: 2,700千円)
|
キーワード | 須恵器 / ヒトの判断基準の検証 / 深層学習クラスター解析 / 数理考古学 / 型式・年代の分類 / 深層クラスター解析 / 型式・年代分類 / ヒト判断根拠の検証 / ボクセルデータ / 3D-RGBAデータ / 光学スキャナー / 未知のクラスターを検知 |
研究開始時の研究の概要 |
最新のデータサイエンス手法を用い、専門家による須恵器の型式および年代の判断基準を深層学習クラスター解析により検証を行う。スキャナーで須恵器資料の3D-RGBデータを計測Voxel化を行う。 ①専門家分類既学習CNNモデルから未知の須恵器3D-RGBデータで型式,年代を推定できる ②専門家のラベルを使わないクラスター解析導出クラスターと①をクラスターマトリックスにて分析することにより、専門家の分類基準の妥当性を数理的に検証できる 本研究ではクラスター結果を疑似ラベルとして3D-CNNに返すループモデルがより高い精度のクラスターを導出し、専門家がこれまで分類したことのない基準でクラスターが導出される。
|
研究実績の概要 |
東京国立博物館所蔵6世紀の完形・略完形須恵器坏の蓋49点および身59点を光学スキャナー解像度0.5mmにて計測を行った。スキャン後にメッシュ出力されたデータを128*128*128解像度Voxelデータに変換した。解析に供試されたデータセットは3D-RGBA(色情報あり)および3D-A(色情報なし形状のみ)の2種類である。それぞれのデータを疑似ラベル教師付き分類+深層クラスターモデルにより6クラスターを出力した。須恵器身の型式データによるクラスター散布図では、ふたつのデータセットでは須恵器編年を大系化した中村浩氏の型式Ⅱ-4およびⅡ-5から成るクラスターがヒト分類と共通するクラスターとして顕著に検出された。導出されたクラスターおよび専門家の型式・年代分類とのクラスター行列では、上記の散布図で確認されたクラスター(クラスター行列ではID-3)における専門家型式分類構成も一致した。その他のクラスターと専門家型式分類の間には明瞭な関係がなく大きな乖離があった。須恵器身の年代解析でも専門家年代分類後葉およびクラスターID-3マッチングよく、それ以外は乖離し、ひとつのクラスター意外に顕著な関連は発見できなかった。 須恵器3Dおよび3方向の2Dデータから形式と年代を同時に出力するCNNモデルを構築し上記専門家の型式・年代ラベルを正解として学習させた分類モデルでは、Voxel解像度を64から128にあげたところ全クラスの平均正解率および再現率が向上した。分類クラスにおける不均衡を少数派のデータクラスに対し損失関数に重み付けを行うことによって,それらが誤分類されたときの損失が大きくなるよう調整する(Weighted Loss Function)ことにより、解決を試みた。これにより、型式の正解率は約58.7%、年代については約71.2%と向上した。 また縄文土器のクラスター解析も開始した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本科研チームでは須恵器等土器のスキャナー計測を行う考古学者と、モデルデザインを行うデータサイエンティスト、さらにモデル構築と解析を実行するプログラマーと3分野に分業しているため非常に効率的に研究が進められる。特に今年度は同様の須恵器データセットを用いながら、深層クラスター解析を研究代表者である藤田と解析チーム、教師付き学習分類を研究分担者である山本と解析チームが独立して研究したため、大きな進展があった。 また、複数の研究費制度による共用設備の購入(合算使用)を利用して当該科研費以外の科研費を合算してNVIDIA GDX Station A100 512GB/320GB GPU AI計算機を導入し、本研究および上記の科研チームが関わる計算処理を専用で使用し、計算機資源が非常に効率よいことも研究の進展に寄与している。 クラスター解析に関する比較を実施するため、縄文土器もスキャナー計測を行ったが、須恵器と比較して大きさや紋様、デザインに多様性があるので、須恵器ほど有意な結果が出ていない。これはサンプル数を大幅に増やす必要があると考えられる。
|
今後の研究の推進方策 |
これまでのところ、k-means法を用いたクラスター解析では専門家の分類基準と大きな乖離がみられ、その原因を追求する。クラスターの大きさが不均一でも対応可能、かつメモリ効率が良好なクラスタリング手法として、Topological Mode Analysis Tool(ToMATo)の利用を検討する。個体差が大きい(外れ値の)須恵器, 複数の型式・年代の特徴を併せ持つ須恵器が存在する可能性も考えられるためである。外れ値に関しては, DBSCANやOPTICSなどの外れ値を扱えるクラスタリングアルゴリズム, 複数のクラスタを割当て可能なFuzzy c-meansなどファジイクラスタリングアルゴリズムの適用を検討している。 今回の解析で明らかになった課題は, voxelデータで須恵器を再構築(再現)した場合, 現行のvoxel化の手法では実寸・法量が反映されていない問題である。解決策としては前述VXelementsアプリケーションで法量・寸法をエンティティデータとして汎用フォーマット(igs,stp,csv等)にて出力し, それをvoxelデータに反映させる方法がある。具体的には, 例えばvoxelの単位を1mm立方体として固定定義し, エンティティデータから須恵器を1mm立法体voxelとして再構築する方法である。 現在の解析では東京国立博物館所蔵の完形・略完形の須恵器を対象としているため, サンプル数が蓋で49, 身で59と数理・データサイエンスの解析用としては非常に少ない問題がある。 今後は各地の窯跡の良好な資料のデータを収集したいと考えるが, 往々にして窯跡資料は欠損や歪みが大きい資料が多い。そのため窯跡に限らず, 古墳や集落遺跡から出土した, 完形かつ歪みが少ない良好な資料についても分類の基準となるデータ(教師データ)として収集したいと考えている。
|