2020 Fiscal Year Annual Research Report
実世界データのための既知・未知データの同時訓練による深層学習に関する研究
Project/Area Number |
20J22372
|
Research Institution | The University of Tokyo |
Principal Investigator |
郁 青 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
Project Period (FY) |
2020-04-24 – 2023-03-31
|
Keywords | 画像認識 / オープンセット認識 / 半教師あり学習 / ラベルクリーニング |
Outline of Annual Research Achievements |
深層学習を訓練するために,大量なアノテーションされているデータが必要であるが,アノテーションを作るために膨大な人力、財力と時間がかかります.アノテーションのコストを減らすために,スクレイピングなどでデータを収集する手法とアノテーションありのデータの数を小さくして,アノテーションなしのデータも訓練に用いる手法が提案されています.しかし,収集されたデータにはラベルノイズや意図外の未知データが含まれる可能性があります.
本研究は,実世界の応用に適したロバストな画像認識の学習手法を構築するのが目的である.令和2年度には,既知のクラス以外のオープンセットデータがデータセットに含まれたとしても,ノイズデータに影響されず精度の高い学習手法の実現に取り組んできました.画像認識の誤動作を回避して,精度を保つためには,次の2課題に取り組みました.(1)データセットにラベルノイズが存在し、かつオープンセットのデータがノイズに含まれるような条件の悪いデータに対して,ラベルノイズの修正を行う同時に,未知クラスのデータをクリーニングを行う手法の提案しました.(2)ラベルありのデータとラベルなしのデータを用いて訓練する半教師あり学習において,ラベルなしのデータに既知のクラス以外のデータが含まれたとしても,未知クラスを適切に除去しながら学習を進める手法の提案を行いました.前者は画像処理の最大の会議であるIEEE ICIPの論文に採択・発表し,後者はコンピュータビジョンのトップコンファレンスであるECCVにて採択,発表しています.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
ロバストな画像認識の学習手法というテーマにおいて,二つの課題について取り組んでいて,筆頭著者として2件の論文が難しい国際会議に採択されましたので,当初の計画以上に進展していると思われます.
|
Strategy for Future Research Activity |
半教師あり学習を用いて,既知クラスの分類器を訓練し,ラベルありデータを増やしながら,未知クラスの検出器の訓練も同時に行うことで,分類器と検出器の精度を同時に向上させる手法を検討しました.その際,画像認識でよく用いられる自然画像のデータセットで実験がある程度可能であるが,実世界での実用性を示すために,より現実的な未知のデータが含まれる実世界のデータセットで実験を行う必要があります.また,提案手法を実世界に応用するために,データセット間のドメインギャップなどのほかの問題を解決し,手法の応用先をさらに考案するつもりです.
|
Research Products
(8 results)