2023 Fiscal Year Annual Research Report
Using a new deep learning approach to properly segment multiscale geographic objects
Project/Area Number |
22KF0051
|
Allocation Type | Multi-year Fund |
Research Institution | University of Tsukuba |
Principal Investigator |
松下 文経 筑波大学, 生命環境系, 准教授 (80361319)
|
Co-Investigator(Kenkyū-buntansha) |
YANG JIAN 筑波大学, 生命環境系, 外国人特別研究員
|
Project Period (FY) |
2023-03-08 – 2024-03-31
|
Keywords | building segmentation / pretrained backbone / hybrid loss function / image balance / UNet |
Outline of Annual Research Achievements |
深層学習アプローチを用いた屋根の抽出に関する研究は、コンピュータービジョン分野とリモートセンシング画像処理分野において盛んに行われながらも挑戦的な研究分野である。ただし、ほとんどの研究はさまざまな深層学習モデルの開発と改良に焦点を当てており、ネットワーク構造の基本要素と画像構成のバランス(すなわち、屋根と背景の比率)の調査に焦点を当てた研究は少ないのが現状である。そこで本研究は、ネットワーク構造の基本要素(Backboneやネットワークの深さなど)およびトレーニング画像の構成バランスを、世界中で広く利用されているU-Netを用いて調査した。まず、既存の深層学習ネットワーク(VGG13、VGG19、ResNet18、DarkNet19、ResNet50、DarkNet53)に対して総合的な分析を行った。その結果、事前に大量のトレーニングデータで学習したBackboneに基づく再学習は、ネットワーク構造の改善や学習層(ネットワークの深さ)を増やすよりも、屋根の分類精度が高くなる。また、トレーニング画像における屋根の占有率(imbalance問題)が抽出精度に大きな影響を与えることも明らかにした。さらに、先行研究で提案されたネットワークの残差構造が屋根の抽出に負の影響を及ぼす可能性があることも示した。以上を踏まえ、残差構造をU-Netに取り込まないこと、事前に学習したU-NetのBackboneを再学習させること、画像構成のバランスを考慮して最適なネットワークを選択することなどの工夫を行い、建物屋根の抽出精度を向上させた。さらに、従来のCNNネットワークに代わって最先端のネットワークTransformerに加え、最近提案されたMask Segmentation手法を使用することで深層学習モデルの汎用性を高めている。
|