Project/Area Number |
21K17756
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 61010:Perceptual information processing-related
|
Research Institution | Tohoku University |
Principal Investigator |
菅沼 雅徳 東北大学, 情報科学研究科, 助教 (00815813)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2023: ¥130,000 (Direct Cost: ¥100,000、Indirect Cost: ¥30,000)
Fiscal Year 2022: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2021: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
|
Keywords | 深層学習 / 画像分類 / ニューラル構造探索 / ドメインシフト / 画像劣化 / 画像修復 / 自動構造探索 / 画像認識 / 構造自動設計 / ニューラルネットワーク |
Outline of Research at the Start |
深層ニューラルネットワークは,コンピュータビジョンの様々なタスクに対し,高い性能を達成している.しかしながら,実用化を進める上で,学習データの分布から外れたデータに対する性能低下(=ドメインシフト)が大きな障壁となっている.例えば,外乱による画像の劣化が生じた場合,同じような画像が学習データに含まれていなければ,その性能は大きく低下してしまう.この問題の解決を目指したドメイン適合手法は,これまで盛んに研究されてきたものの,未だ決定打には程遠い.そこで本研究では,従来行われてこなかったアプローチとして,ドメインシフトに頑健なネットワークの構造を自動で作り出すことで,上述の課題解決を目指す.
|
Outline of Annual Research Achievements |
申請当初の研究計画に従い,研究を進めている. 昨年度同様,画像認識における主要な深層学習モデルである畳み込みニューラルネットワーク(CNN)に関して,ドメインシフト(画像劣化)に対する頑健性を実験的に調べた.具体的には,これまでに提案されてきた様々なCNNモデルに対して,画像劣化が各モデルにどのような影響を与えるのかを実験的に調査した.結果として,どのようなネットワークの構成要素,どのようなそれらの組み合わせがより優れた頑健性を示すのか,一定の成果を得ることができた.また,CNNのネットワーク構造だけでなく,画像劣化を引き起こす外乱の種類によっても,画像分類の性能が大きく変化することも発見した. また,CNNだけでなく,近年CNNに比肩する性能を示し,注目を集めているVision Transformerについても,その画像劣化に対する頑健性を検証している.まずは,どのようなVision Transformerの構造が優れた頑健性を示すのかを網羅的に検証するために,Vision Transformerのための構造探索手法の開発を試みた.なお,一般的には,深層学習モデルの構造探索には膨大な計算コストが必要となるため,効率的な探索手法の開発が必要となる.そこで,今年度は効率的なVision Transformerの構造探索手法の開発に注力した.結果として,既存研究より効率の良い探索が実現可能になったが,まだ改善の余地があるため,引き続き改良を行っていく予定である.また,効率的な探索手法が確立した後,画像劣化によるドメインシフトへの頑健性を調査する予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
自動構造探索手法を用いた,ドメインシフトに対する頑健性の性能評価は,やや予定よりも遅れた進捗となっている.進捗が遅れている主な理由は,Vision Transformerの効率的な構造探索手法の開発が若干難航しているためである.
|
Strategy for Future Research Activity |
網羅的な評価実験を行うために,まずは効率的な構造探索手法の確立を目指す.それから,どのような構造要素がどれほど,どのようなメカニズムによって,頑健性の向上に寄与しているのかの解釈を進めていく.これにより,最終目標であるドメインシフト(画像劣化)に頑健なネットワーク構造のデザインの一般的な方法論を見出す. また,最近ではあらゆる問題にVision Transformerが適用され,そのいくつかでCNNよりも優れた性能を示しつつある.こういった最新の研究動向も踏まえつつ,研究計画を柔軟に修正しながら,研究を遂行していく.
|