本研究では,単一のニューラルネットワークに複数のタスクのための機能を同時に学習させ,学習した独立の機能の組み合わせ・重ね合わせによって,事前に学習した個別の単一機能とは異なる,新しい機能を実現し,Neural Networkがより人間の脳に近い汎用的な能力を持っていることを実証することを目的とする.また,複数機能の組み合わせによる実用的な応用についても検討する. 本研究の2年目は画像変換の様に複数のタスクを融合な可能なタスクを想定して,タスク融合学習の実現に向けて研究を進める予定であった.具体的には,領域分割,超解像,白黒画像のカラー化,インペインティング,スタイル変換,画像ドメイン変換,画像変換タスクなど,多様な画像変換タスクに関して,同時学習および組合せタスクの学習実験を行う予定であったが,最新の画像生成モデルであるStable Diffusionでのタスク融合学習での実現可能性について検討するうちに,大規模学習データで学習済の画像生成モデルであるStable Diffusionがゼロショットで任意の言葉に対応した領域分割が可能である性質を発見し,主にそれに関する研究に重点をおいて実施した.その結果,大きな成果をあげることができ,日本最大の画像認識シンポジウムで優秀研究賞を受賞する成果を挙げることができた.
|