データに乏しい状況において、学習データを生成しながらAIモデルを構築する取り組みが広く行われている。我々は、自己訓練に戻づく半教師付き学習フレームワークを提案した。まず、既知のデータを学習に用いて、AIモデルを構築する。次に、相互作用情報が未知の化合物-タンパク質ペアに疑似ラベルを生成し、学習データを増やし、モデルパラメータを改良していく。その結果、学習データのポジネガの不均衡が徐々に緩和され、さらに最終的に構築されたモデルは、既知の学習データセットのみを用いて構築された初期モデルを凌駕することが示された。
|