公募研究
生成モデルの深層学習の一つであるDCGAN(Deep Convolutional Generative Adversarial Network)を用いて、一人称視点で撮影された動画データ・セットを用いて、場所の時間的な変遷が内部状態空間にエンコードされることを示し、さらにVAEGAN(Variational AutoEncoder +GAN)という手法を用いることで、place cell的なニューロンをGANの潜在空間上に生成することができた。また同様にDCGANを用いて、音色生成のシステムを構築した。これは、単色の音の入力列をフーリエスペクトラムを生成して入力するが、GANの性質から新しい音の周波数と音色が生成されうることを示した。これらはともに潜在空間のエンコードの複雑さに注目した研究で、深層学習の研究ではあまり成果のないところであり、注目される。特に、動画データセットの場合には、位置細胞としてのエンコーディングと対応つけることができ、それは深層学習のモデルと実際の脳の構造を結びつけるヒントとなるという意味で評価される。
2: おおむね順調に進展している
本研究は、当初見込んだように深層学習の中でもGANを用いることで、データセットの貧弱さとは関係のない、複雑な学習が可能である。この生成系であることが脳の知覚の本質であるということを明らかにしようという点では、予想したとおりである。
今後の予定としては、DCGANであると、入力データの間の近さが潜在空間に反映されないので、別な生成系を用いることが必要である。それを用いて、潜在空間の中のコーディングを考察する必要がある。また、音の生成の場合には、より生成系の能力を上げることが必要である。音色の多様性がまだ足りていない。
すべて 2017
すべて 雑誌論文 (4件) (うち国際共著 1件、 査読あり 4件) 学会発表 (5件) (うち国際学会 3件)
Proc of the 14th European Conference on Artificial Life (ECAL2017)
巻: 29 ページ: 490-496
https://doi.org/10.7551/ecal_a_080
巻: 29 ページ: 380-387
https://doi.org/10.7551/ecal_a_065
巻: 29 ページ: 275-282
https://doi.org/10.7551/ecal_a_048
Proc of the 2nd International Symposium on Swarm Behavior and Bio-Inspired Robotics (SWARM 2017)
巻: - ページ: 279-286