2021 Fiscal Year Annual Research Report
実世界データのための既知・未知データの同時訓練による深層学習に関する研究
Project/Area Number |
20J22372
|
Research Institution | The University of Tokyo |
Principal Investigator |
郁 青 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2020-04-24 – 2023-03-31
|
Keywords | 画像認識 / オープンセット認識 / ドメイン適応 |
Outline of Annual Research Achievements |
性能が高い深層学習モデルを構築ために,通常大量なアノテーションありデータが必要であり,そのために膨大な人力、財力と時間がかかります.アノテーションのコストを減らすために,アノテーションありのデータの数を小さくして,アノテーションなしのデータも訓練に用いる手法が提案されています.しかし,スクレイピングなどでデータを収集する際にはラベルノイズや意図外の未知データが含まれる可能性があります.
本研究の目的は,実世界の応用に適したロバストな画像認識の学習手法を構築することである.令和3年度には,ノイズデータがデータセットに含まれたとしても,それに影響されず精度がロバストな深層学習モデルの構築に取り組んできました.ノイズデータによる悪影響を回避するためには,次の2課題に取り組みました.(1)アノテーションありデータとアノテーションなしデータの間にドメインギャップが存在するドメイン適応というタスクにおいて,データセットにラベルノイズが存在し、かつ未知データがノイズに含まれるような条件の悪いデータに対しても,正しくアノテーションありデータから特徴量を学習し,それをアノテーションなしデータに適応される手法を提案しました.(2)アノテーションなしデータに複数のクラスで構成させる未知データが存在する場合に,その未知データもセマンティックによる正しくクラスターリングすることで,精度が高いone-shot learningを実現できる手法を提案しました.前者はコンピュータビジョンの最難関の会議であるCVPRてに採択・発表し,後者は人工知能のトップコンファレンスであるAAAIにて採択・発表しました.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
ロバストな画像認識モデルというトピックにおいて,筆頭著者として二つの課題について取り組み,両方とも難関国際会議に採択されましたので,当初の計画以上に進展していると思われます.
|
Strategy for Future Research Activity |
いままでの研究は半教師あり学習やドメイン適応などのタスクで進みましたが,いずれも静止画像のクラス分類を対象としました.実世界での汎用性を広げるために,動画の認識などに対応できる手法を考案するつもりです.
|