2023 Fiscal Year Research-status Report
Challenges to cognitive super-resolution techniques based on contextual bias for sense of "Unnatural"
Project/Area Number |
23K18490
|
Research Institution | Yokohama National University |
Principal Investigator |
濱上 知樹 横浜国立大学, 大学院工学研究院, 教授 (30334204)
|
Project Period (FY) |
2023-06-30 – 2026-03-31
|
Keywords | VisionTransformer / 超解像 / 医用画像 |
Outline of Annual Research Achievements |
正常と異常の境界領域付近という意味ではなく、ある種の経験的仮説をもって画像中の特徴を読み取ったときに認知上に現れる非言語的情報を扱う「認知的超解像」の技術として、ViT(Vision Transformer)で学習された文脈バイアスの抽出を試みた。初年度には①動体からの認知的超解像、②静止画像からの超解像を試みた。①として、MRI画像からの卵巣がん種判定を試み、CNNとViTを組み合わせたモデル(HybridViT)とFocal lossを併用するマルチモーダル学習で判定精度を75%→94%に向上させることに成功した。②として生殖医療における精子評価の手法としてTimesFormerをエンコーダーとして文脈バイアスと取り出し、またAttention スコアに基づいて重要な局所パッチを選択するPatch Selection Module(PSM)およびPSM で選択された局所パッチを効果的に利用し,細粒度な空間特徴と時間特徴を分離して明示的に抽出するRole-Separated Branch (RSB) を併用した方法を考案した。ベースラインとした、R3D, X3D, I3D, SlowFast, VIViT, TimesFormerに比べ優位性を示すことができた。これらの成果は、文脈バイアスに基づく認知的超解像技術の有効性を示す成果として重要な意味を持つ。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ViTを発展させた文脈バイアス抽出法として、静止画、動画それぞれに対して典型的な手法を提案し、かつベースラインとなる手法との比較によって有効性を示すことができた。いずれも医療画像分析においてSoTAとなる結果であり、ドメイン依存の部分は残るとしても一定の有効性・新規性を実現できた。
|
Strategy for Future Research Activity |
データが十分に集まらない場合についての検証、医療応用を中心に置きながらも、ドメイン依存にならないあるいは認知的超解像のドメイン転移についても検討を進める。
|
Causes of Carryover |
基盤技術となる成果の早期展開のために、国際会議旅費・参加費等を優先する一方、論文誌掲載の確定が年度をまたぐことが明らかとなったため、高額な掲載料を次年度に繰り越すことが必要だったため。
|