研究実績の概要 |
前年度までgroup-based variational autoencoder (GVAE)を開発し、その上でワンショット学習の枠組みを考案した。今年度はさらに拡張して、高次視覚野の一般物体のモデルを深層学習モデルCIGMOを構築した。深層学習モデルGVAEの混合モデルとを考え、高次視覚野の物体のカテゴリに対応 して混合コンポネントを考えることにし、それぞれのコンポネントのGVAEが、各カテゴリの恒常的な表現となるようにした。このようなモデルを生成モデルとして定式し、VAE法で学習するアルゴリズムを構築した。ShapeNetデータセットを用いて、グループベースの学習で訓練した。隠れ変数としてカテゴリごとの恒常的な形状表現が得られるため、これを用いたワンショット学習を行い、定量的に性能測定をした。また、GVAEやMLVAE,VAEなどと比較したところ、性能で凌駕した。これにより、カテゴリ化により、表現がより特化し、それにより下流タスクの性能向上につながるという結果を得た。さらに、CIGMOを用い、swappingやinterpolation, random generationなどの、画像生成タスクを行い、定性的に期待する動作を確認した。
|