深層学習では、大規模データが特に重要であるが、裏を返せばそのデータを取得・作成するための時間的・金銭的コストが大きな問題となる。本研究の目的は、この問題を解決するために、ドメイン適応、弱/半教師付き学習、Few/Zero-Shot学習など少量のデータでも学習可能なアルゴリズムを実現することである。 2021年度は、特にラベル等が付与されていない状況大量のデータがある場合の自己教師あり学習、及び各クラスの学習データがアンバランスな場合のアンバランス学習に注力した。 自己教師あり学習については、Inter-Intra Contrastive Learningという新しい対象学習手法を提案し、映像認識のタスクにおいて従来研究を上回る性能を達成した。また、画像の審美性を評価タスクするタスクにおいてMasked Image Modeling (MiM)をいう手法を利用した自己教師あり学習手法を提案し、優れた性能を実現した。これらの手法により、ラベルがなくとも大量のデータを準備すればある程度の精度をもった認識器を設計できることを示した。 アンバランス学習については、スライドのデザイン良し悪し判定を対象に、データのアンバランスに対応できるロスの設計やサンプリング手法を組み合わせることで80%程度の認識性能を実現した。アンバランスな学習データでは学習がうまく進まないなどの指摘がされていたが、対応策を示すことができたと考えている。また、開発した手法はタスクによらず一般的に適用可能なものである。このアルゴリズムについては、企業にライセンス提供を行った。
|