2023 年度研究成果報告書

機能の重ね合せを実現する深層学習におけるタスク融合学習

研究課題

PDF

研究課題/領域番号	22K19808
研究種目	挑戦的研究(萌芽)
配分区分	基金
審査区分	中区分61:人間情報学およびその関連分野
研究機関	電気通信大学
研究代表者	柳井啓司電気通信大学, 大学院情報理工学研究科, 教授 (20301179)
研究期間 (年度)	2022-06-30 – 2024-03-31
キーワード	深層学習 / 継続学習 / 大規模モデル / 視覚言語モデル
研究成果の概要	本研究では，単一のニューラルネットワークに複数のタスクのための機能を同時に学習させ，学習した独立の機能の組み合わせ・重ね合わせによって，事前に学習した個別の単一機能とは異なる，新しい機能を実現することを目的として研究を行った．具体的には(1)条件信号による画像変換タスクの重ね合わせ，(2)Vision Transformerの継続学習，(3)Stable Diffusionによる学習なしでの任意の言葉に対する領域分割の実現，について成果を得ることができた．
自由記述の分野	メディア情報学
研究成果の学術的意義や社会的意義	本研究によって，ニューラルネットワークには，異なる機能の同時学習に関してより柔軟に対応できる能力が備わっていることが示された．また，10億スケールの大規模画像言語ペアデータで学習されたテキストからの画像生成モデルには，テキストと視覚概念をピクセルレベルで対応付ける能力が備わっていることが示され，追加の学習なしで多様なタスクに活用できる可能性が大いに高まったと言える．今後は，この学習なしの能力を多様なタスクに対して実証し，それらの複合的な処理も学習無しで実現することを追求することで，大規模視覚言語モデルの応用可能性を大いに広げることが可能となる．