研究課題/領域番号 |
22K19808
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分61:人間情報学およびその関連分野
|
研究機関 | 電気通信大学 |
研究代表者 |
柳井 啓司 電気通信大学, 大学院情報理工学研究科, 教授 (20301179)
|
研究期間 (年度) |
2022-06-30 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
6,370千円 (直接経費: 4,900千円、間接経費: 1,470千円)
2023年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2022年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
|
キーワード | 深層学習 / 継続学習 / 大規模モデル / 視覚言語モデル / 連続学習 / Vision Transformer / Stable Diffusion / Zero-shot segmentation / マルチタスク学習 |
研究開始時の研究の概要 |
本研究では,単一のCNN (Convolutional Neural Network, 畳み込みネットワーク)に複数のタスクのための機能を同時に学習させ,学習した独立の機能の組み合わせ・重ね合わせによって,事前に学習した個別の単一機能とは異なる,新しい機能を実現し,Neural Networkがより人間の脳に近い汎用的な能力を持っていることを実証することを目的とする.また,複数機能の組み合わせによる実用的な応用についても検討する.
|
研究成果の概要 |
本研究では,単一のニューラルネットワークに複数のタスクのための機能を同時に学習させ,学習した独立の機能の組み合わせ・重ね合わせによって,事前に学習した個別の単一機能とは異なる,新しい機能を実現することを目的として研究を行った.具体的には(1)条件信号による画像変換タスクの重ね合わせ,(2)Vision Transformerの継続学習,(3)Stable Diffusionによる学習なしでの任意の言葉に対する領域分割の実現,について成果を得ることができた.
|
研究成果の学術的意義や社会的意義 |
本研究によって,ニューラルネットワークには,異なる機能の同時学習に関してより柔軟に対応できる能力が備わっていることが示された.また,10億スケールの大規模画像言語ペアデータで学習されたテキストからの画像生成モデルには,テキストと視覚概念をピクセルレベルで対応付ける能力が備わっていることが示され,追加の学習なしで多様なタスクに活用できる可能性が大いに高まったと言える.今後は,この学習なしの能力を多様なタスクに対して実証し,それらの複合的な処理も学習無しで実現することを追求することで,大規模視覚言語モデルの応用可能性を大いに広げることが可能となる.
|