2020 Fiscal Year Annual Research Report
Computational model of face network in inferotemporal cortex based on mixture of sparse coding models
Project/Area Number |
18K11517
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
細谷 晴夫 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主任研究員 (50335296)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 高次視覚野 / 機械学習 / 深層学習 |
Outline of Annual Research Achievements |
前年度に開発したgroup-based variational autoencoder (GVAE)をさらに拡張して、高次視覚野の一般物体のモデルを深層学習モデルとして構築した。ここでは、混合スパース符号化モデルでも用いたアイデアを応用し、深層学習モデルGVAEの混合モデルとして構築した。すなわち、高次視覚野の物体のカテゴリに対応して混合コンポネントを考えることにし、それぞれのコンポネントのGVAEが、各カテゴリの恒常的な表現となっている。このようなモデルを生成モデルとして定式し、VAEの方法論で学習するというアルゴリズムを構築した。ShapeNetという物体画像のデータセットを用いて、グループベースの学習で訓練したところ、物体カテゴリがラベルなしで現れた。恒常的クラスタリングのタスクで、既存のモデルであるInvariant Information Clustering法や、GVAEとk-meansの組み合わせなどと複数に対して定量比較したところ、性能で凌駕することがわかった。
|