研究領域 | 土器を掘る:22世紀型考古資料学の構築と社会実装をめざした技術開発型研究 |
研究課題/領域番号 |
21H05359
|
研究機関 | 独立行政法人国立文化財機構東京国立博物館 |
研究代表者 |
山本 亮 独立行政法人国立文化財機構東京国立博物館, 学芸研究部, 研究員 (30770193)
|
研究期間 (年度) |
2021-09-10 – 2023-03-31
|
キーワード | ディープラーニング / 土器 / 須恵器 / 分類 |
研究実績の概要 |
東京国立博物館が所蔵する古墳時代・6世紀の須恵器蓋杯のうち、完形もしくは略完形のもの100点超を3Dデータ化した。依然として資料数は少ないが、対象資料は回転体であり正面をもたないため、1個体にあたり垂直軸で30度ずつ回転させた12個の拡張データを用意してディープラーニングを試行することとした。 ディープラーニングの試行にあたり、いったんモデルについては開発中のものを用い、検討対象として3Dデータのみを用いることとして以下の2つの方法を行った。まず教師有り分類として、解像度を落とした3Dデータと、同じ3Dデータから生成した上面・下面・側面の正射投影2D画像を併せて学習に用いることとした。結果は正解率と再現率について高い成果を示すものがある一方で低い率に留まるものがあり、後者は特にデータ数が未だ十分ではないことによるものと考えられた。次に3Dデータのみを用い、疑似ラベルによるクラスタリング分析を行った。ここでは当研究のようにCNN(畳み込みニュートラルネットワーク)で画像分類を行う場合に判断根拠手法となるGrad-CAMを用いることにより、ディープラーニングにおいてコンピューターが3Dデータのどの部分を参照したか可視化した。これにより、分類の妥当性やVoxel化したデータを用いることで生じる課題を見出すことができた。また疑似ラベルによるクラスタリングでは同じ個体から生成した12個の拡張データはグラフ上でほぼ同じ位置にプロットされることを確認し、拡張データを使用する妥当性を検証できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
一部データの取得数が十分ではない。ディープラーニングに際して資料の欠損箇所や補修箇所がノイズとなる恐れがあったため、データ取得の対象となる資料を完形もしくは略完形のものに限定した。そのため東京国立博物館が所蔵する資料のみを用いる場合、分類を試みた5時期のうちデータを拡張したとしても一部で教師データ数が十分ではない分類が存在することとなった。また対象資料としては東京国立博物館が所蔵する同様の資料約600点のうち100点程度のみを用いることとなった。これは東京国立博物館所蔵の資料ではこれ以上の増加は見込めず、他機関所蔵資料を加えてよりデータ数を増やす必要が生じたが、新型コロナウイルス感染症の影響もあり他機関に赴いてのデータ取得は行うことを控えざるをえなかった。
|
今後の研究の推進方策 |
必要な作業としてデータ数を増やすことがあげられる。まずデータ数が十分ではない時期の資料からデータを取得する必要がある。また取得済みのデータでも、資料はなるべく古墳時代当時の中心的な窯場がある近畿地方の資料が中心となるよう留意し、明確に産地が異なると判断される資料は検討対象から外したものの、一部に西日本から東日本まで広い地域の資料を扱わざるを得なかったところがある。国内他機関に赴き、各分類について教師数が不足している分類に該当する資料のデータをより多く取得するよう努める。また欠損や補修箇所がみられる資料でも、画像処理によってディープラーニングの際にノイズを生じないような手法を試行する。また現状では用いることができる計算資源の制限から3Dデータについては解像度を落として試行を重ねており、今後は高度計算資源を用いてより高解像度の3Dデータをもとに検討を進める。また、形態に限らず法量などの年代に関わる情報も追加したい。
|