3Dマルチ入力・マルチ出力土器分類DLモデルの開発研究
Publicly Offered Research
Project Area | Excavating earthenware: Technology development-type research for construction of 22nd century archeological study and social implementation |
Project/Area Number |
21H05359
|
Research Category |
Grant-in-Aid for Transformative Research Areas (A)
|
Allocation Type | Single-year Grants |
Review Section |
Transformative Research Areas, Section (I)
|
Research Institution | Tokyo National Museum |
Principal Investigator |
山本 亮 独立行政法人国立文化財機構東京国立博物館, 学芸研究部, 研究員 (30770193)
|
Project Period (FY) |
2021-09-10 – 2023-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥5,200,000 (Direct Cost: ¥4,000,000、Indirect Cost: ¥1,200,000)
Fiscal Year 2022: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Fiscal Year 2021: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | ディープラーニング / 土器 / 須恵器 / 分類 |
Outline of Research at the Start |
これまで一部の専門家により行われてきた土器を主とする考古資料の分類認定をディープラーニングに転換する手法の開発を目的とする。計測の対象とする土器は古墳時代・6世紀の須恵器とし、従来の形態・色・質感を表すカラー画像2Dデータに加え、形状3Dデータおよび資料複数箇所の法量1Dデータを同時に入力、年代推定および型式分類を認定しうる革新的な手法を開発する。
|
Outline of Annual Research Achievements |
東京国立博物館が所蔵する古墳時代・6世紀の須恵器蓋杯のうち、完形もしくは略完形のもの100点超を3Dデータ化した。依然として資料数は少ないが、対象資料は回転体であり正面をもたないため、1個体にあたり垂直軸で30度ずつ回転させた12個の拡張データを用意してディープラーニングを試行することとした。 ディープラーニングの試行にあたり、いったんモデルについては開発中のものを用い、検討対象として3Dデータのみを用いることとして以下の2つの方法を行った。まず教師有り分類として、解像度を落とした3Dデータと、同じ3Dデータから生成した上面・下面・側面の正射投影2D画像を併せて学習に用いることとした。結果は正解率と再現率について高い成果を示すものがある一方で低い率に留まるものがあり、後者は特にデータ数が未だ十分ではないことによるものと考えられた。次に3Dデータのみを用い、疑似ラベルによるクラスタリング分析を行った。ここでは当研究のようにCNN(畳み込みニュートラルネットワーク)で画像分類を行う場合に判断根拠手法となるGrad-CAMを用いることにより、ディープラーニングにおいてコンピューターが3Dデータのどの部分を参照したか可視化した。これにより、分類の妥当性やVoxel化したデータを用いることで生じる課題を見出すことができた。また疑似ラベルによるクラスタリングでは同じ個体から生成した12個の拡張データはグラフ上でほぼ同じ位置にプロットされることを確認し、拡張データを使用する妥当性を検証できた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
一部データの取得数が十分ではない。ディープラーニングに際して資料の欠損箇所や補修箇所がノイズとなる恐れがあったため、データ取得の対象となる資料を完形もしくは略完形のものに限定した。そのため東京国立博物館が所蔵する資料のみを用いる場合、分類を試みた5時期のうちデータを拡張したとしても一部で教師データ数が十分ではない分類が存在することとなった。また対象資料としては東京国立博物館が所蔵する同様の資料約600点のうち100点程度のみを用いることとなった。これは東京国立博物館所蔵の資料ではこれ以上の増加は見込めず、他機関所蔵資料を加えてよりデータ数を増やす必要が生じたが、新型コロナウイルス感染症の影響もあり他機関に赴いてのデータ取得は行うことを控えざるをえなかった。
|
Strategy for Future Research Activity |
必要な作業としてデータ数を増やすことがあげられる。まずデータ数が十分ではない時期の資料からデータを取得する必要がある。また取得済みのデータでも、資料はなるべく古墳時代当時の中心的な窯場がある近畿地方の資料が中心となるよう留意し、明確に産地が異なると判断される資料は検討対象から外したものの、一部に西日本から東日本まで広い地域の資料を扱わざるを得なかったところがある。国内他機関に赴き、各分類について教師数が不足している分類に該当する資料のデータをより多く取得するよう努める。また欠損や補修箇所がみられる資料でも、画像処理によってディープラーニングの際にノイズを生じないような手法を試行する。また現状では用いることができる計算資源の制限から3Dデータについては解像度を落として試行を重ねており、今後は高度計算資源を用いてより高解像度の3Dデータをもとに検討を進める。また、形態に限らず法量などの年代に関わる情報も追加したい。
|
Report
(1 results)
Research Products
(2 results)