前年度に開発したgroup-based variational autoencoder (GVAE)をさらに拡張して、高次視覚野の一般物体のモデルを深層学習モデルとして構築した。ここでは、混合スパース符号化モデルでも用いたアイデアを応用し、深層学習モデルGVAEの混合モデルとして構築した。すなわち、高次視覚野の物体のカテゴリに対応して混合コンポネントを考えることにし、それぞれのコンポネントのGVAEが、各カテゴリの恒常的な表現となっている。このようなモデルを生成モデルとして定式し、VAEの方法論で学習するというアルゴリズムを構築した。ShapeNetという物体画像のデータセットを用いて、グループベースの学習で訓練したところ、物体カテゴリがラベルなしで現れた。恒常的クラスタリングのタスクで、既存のモデルであるInvariant Information Clustering法や、GVAEとk-meansの組み合わせなどと複数に対して定量比較したところ、性能で凌駕することがわかった。
|