研究課題
若手研究
ニューラルネットワークは従来の画像認識タスクの枠を超えて大規模言語モデルや基盤モデルなどの方向性で急速に進展し,現在の人工知能ブームを作り出している.その優れた汎化性能を達成するために,ニューラルネットワークのパラメータは,損失関数に関する勾配に基づいて最適化されるが,勾配はモデルの学習に関する様々な要因に左右され,時に,汎化が達成できない勾配や学習が破綻するような勾配が得られる場合がある.本研究課題では,勾配のノイズやその成分と特性に着目し,優れた汎化性能を達成するための勾配の推定方法を検討する.