生成モデルが、画像や音声、言語など多様なデータ形式に対して、精度の高いデータを出力できるのは、データをその実世界での姿に依存しない形で抽出し表現できているからです。その表現を、実世界での姿に依らないデータの本質だと期待して、潜在表現と呼んでいます。対象とするデータに対して良い潜在表現を獲得する方法を提案し、潜在空間上でのデータ間の相互関係やデータ分布を使うことで、あるデータセットでの学習結果を他のデータセットに転用して利用できるドメイン適応や、異常データ検知器の構築に正常データだけを用いる学習などを、高精度で実現しました。
|