研究課題/領域番号 |
20J22372
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分61010:知覚情報処理関連
|
研究機関 | 東京大学 |
研究代表者 |
郁 青 東京大学, 情報理工学系研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2020-04-24 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
2,500千円 (直接経費: 2,500千円)
2022年度: 800千円 (直接経費: 800千円)
2021年度: 800千円 (直接経費: 800千円)
2020年度: 900千円 (直接経費: 900千円)
|
キーワード | 画像認識 / オープンセット認識 / ドメイン適応 / 半教師あり学習 / ラベルクリーニング |
研究開始時の研究の概要 |
本研究は実世界の応用に柔軟に対応しうるロバストな画像認識フレームワークを構築することを目指している.ラベルありのデータとラベルなしのデータを用いて訓練する半教師あり学習において,ラベルなしのデータに既知のクラス以外のデータが含まれたとしても,ノイズデータに影響されず精度の高い半教師あり学習を実現する手法を提案する.
|
研究実績の概要 |
性能が高い深層学習モデルを構築ために,通常大量なアノテーションありデータが必要であり,そのために膨大な人力、財力と時間がかかります.アノテーションのコストを減らすために,アノテーションありのデータの数を小さくして,アノテーションなしのデータも訓練に用いる手法が提案されています.しかし,スクレイピングなどでデータを収集する際にはラベルノイズや意図外の未知データが含まれる可能性があります. 本研究の目的は,実世界の応用に適したロバストな画像認識の学習手法を構築することである.令和4年度には,データセットに未知データが含まれた場合,データの数が少ない状況でも,精度がロバストな深層学習モデルの構築に取り組んできました.データの少なさによる悪影響を回避するためには,次の2課題に取り組みました.(1)アノテーションありデータとアノテーションなしデータの間にドメインギャップが存在するドメイン適応というタスクにおいて,アノテーションありデータの数が非常に少ない条件でも,正しくアノテーションありデータとアノテーションなしデータから特徴量を学習し,アノテーションなしデータの既知クラスと未知クラスを正しく分類できる手法を提案しました.(2) ドメイン適応のタスクにおいて,大規模データで学習された言語と画像のマルチモーダル基盤モデルCLIPを利用することで,既存のドメイン適応よりも大幅に精度が高い手法を提案しました.前者はマルチメディアのトップジャーナルであるIEEE Transactions on Multimediaに投稿し,後者はコンピュータビジョンの最難関国際会議であるICCVに投稿しました.また,インターンシップでノイズが含まれる動画認識の研究を行いました.人間の動作に着目した行動局所化により,1回のラベル付けのみで動画内の全フレームのラベル付けを完了する手法を提案しました.その成果はトップコンファレンスのAAAIに採択されました.
|
現在までの達成度 (段落) |
令和4年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和4年度が最終年度であるため、記入しない。
|