深層生成モデルの潜在空間を用いたドメイン適応(DA)や異常検知に取り組んだ。生成モデルとしては、変分自己符号化器(VAE)、敵対的生成ネット(GAN)の生成器と判別器に加えて符号化器の組合せ、拡散モデル等を用いて潜在表現を獲得した。潜在表現をタスクとドメインに高精度で切り分ける分類器による学習法や、それを用いてタスクとドメインを任意に組合せた疑似データの生成、さらにそれを用いたユニバーサルDA法を提案した。 DAは、潜在空間におけるソースとターゲットの両ドメインのデータ分布を一致させることで実現するが、そこで用いる分布間距離を検討した。輸送距離最小化で定義されるWasserstein距離が有効な事例を、実験的に検証した。より一般的に用いられるKLダイバージェンスでは、両分布の密度比が得られることに着目し、DA用の判別器と独立に、密度比計測用の判別器群を導入した。その結果、両分布間およびクラス分布の密度比をDA過程で常に計測しDAに反映することで、未知クラス判別も高精度で実現し、両ドメインのクラス集合の包含関係に依らない、一般的な枠組みでのDA法を構築した。 正常データの潜在表現を用いた異常検知法を、生物や医療データに適用した。3次元時系列データの網羅的な蓄積と遺伝学的知見が豊富なモデル生物である線虫の初期胚発生データに適用し、従来の特徴量群を用いた逆遺伝学の結果と比較した。また、肝臓CT画像から異常領域としての腫瘍セグメンテーションを行った。
|