2018 Fiscal Year Annual Research Report
Deep generative learning theory for complex perception
Publicly Offered Research
Project Area | Understanding human recognition of material properties for innovation in SHITSUKAN science and technology |
Project/Area Number |
18H05021
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
細谷 晴夫 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主任研究員 (50335296)
|
Project Period (FY) |
2018-04-01 – 2020-03-31
|
Keywords | 機械学習 / 視覚皮質 / 深層学習 / 確率的生成モデル |
Outline of Annual Research Achievements |
本研究では、幅広い質感ドメインに適用可能な生成モデル理論を開発するため、教師なし学習による生成モデルの構築を目指す。教師なし学習モデルと視覚神経表現との関係を扱った研究代表者のこれまでの研究に加え、近年の機械学習アプローチである「深層生成学習モデ ル」を取り入れることで、質感研究に適した汎用性の高い生成学習理論の構築を目的とする。本年度では、そのようなモデルとして、(1) 高次元かつ大規模なデータセットに対しても実用的効率で学習可能、(2) 複数の特徴パラメタを互いに統計的に独立した変数として推定可能、(3) 訓練データにない新規の刺激を生成できる高い汎化性能、(4) 質感特有の高次統 計を捉えることのできる非線形性、を兼ね備えたモデルの開発を進めた。具体的には、同内容のデータアイテムを一つのグループにし、そのようなグループ多数からなる「グループ化データセット」を仮定するというアプローチを考案した。グループ化されたデータから、共通因子は「内容」、それ以外の因子は「変形」として推定できるようにした。この考えを、効率的なアルゴリズムとして実現するため、Variational autoencoder法をベースに手法を設計し、実装を行なった。これを用いて3次元顔画像のデータセットをグループ化し、アルゴリズムに適用したところ、期待されたように内容と変形の因子を分離して推定できることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の目標は、深層生成学習の手法を設計・実装することであったが、概ね完成している。
|
Strategy for Future Research Activity |
今後は、3次元物体の画像を始め、様々なデータセットに適用し性能評価をしていく。特に、訓練データにない内容を持つデータに関して、適切に特徴パラメタを推定可能かどうか、 について評価し、既存手法との定量的な比較を行っていく。また、さらなる性能向上を目指して、generative adversarial network法などの併用なども検討していく。さらに、学習で得られた生成モデルの性質と、過去に報告された神経科学・心理学の実験事実と比較する。特に、このモデルを用いて多階層のネットワークモデルを設計し、サルの顔領域について知られている神経生理学的な性質の再現可能性を調べるとともに、生成型でないフィードフォワードの深層学習モデルとの比較も検討する。
|