One-shot learning model based on computational theory of higher visual cortex
Publicly Offered Research
Project Area | Correspondence and Fusion of Artificial Intelligence and Brain Science |
Project/Area Number |
19H04999
|
Research Category |
Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
|
Allocation Type | Single-year Grants |
Review Section |
Complex systems
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
細谷 晴夫 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主任研究員 (50335296)
|
Project Period (FY) |
2019-04-01 – 2021-03-31
|
Project Status |
Completed (Fiscal Year 2020)
|
Budget Amount *help |
¥11,700,000 (Direct Cost: ¥9,000,000、Indirect Cost: ¥2,700,000)
Fiscal Year 2020: ¥5,850,000 (Direct Cost: ¥4,500,000、Indirect Cost: ¥1,350,000)
Fiscal Year 2019: ¥5,850,000 (Direct Cost: ¥4,500,000、Indirect Cost: ¥1,350,000)
|
Keywords | 機械学習 / 深層生成学習 / 恒常性 |
Outline of Research at the Start |
ワンショット学習は、脳の最も驚くべき汎化能力の一つである。例えば、顔画像を一例だけ覚えておくだけで、どの方向を向いた顔を見せられても認識できる。ワンショット学習は、人工知能分野でも時折取り上げられる難問であるが、決定的なアルゴリズムはまだなく、黎明期の技術である。本研究では、神経科学における高次視覚野の理論的・実験的知見と、深層生成学習という近年の機械学習技術を融合することにより、高性能なワンショット学習の人工実現を目指す。
|
Outline of Annual Research Achievements |
前年度までgroup-based variational autoencoder (GVAE)を開発し、その上でワンショット学習の枠組みを考案した。今年度はさらに拡張して、高次視覚野の一般物体のモデルを深層学習モデルCIGMOを構築した。深層学習モデルGVAEの混合モデルとを考え、高次視覚野の物体のカテゴリに対応 して混合コンポネントを考えることにし、それぞれのコンポネントのGVAEが、各カテゴリの恒常的な表現となるようにした。このようなモデルを生成モデルとして定式し、VAE法で学習するアルゴリズムを構築した。ShapeNetデータセットを用いて、グループベースの学習で訓練した。隠れ変数としてカテゴリごとの恒常的な形状表現が得られるため、これを用いたワンショット学習を行い、定量的に性能測定をした。また、GVAEやMLVAE,VAEなどと比較したところ、性能で凌駕した。これにより、カテゴリ化により、表現がより特化し、それにより下流タスクの性能向上につながるという結果を得た。さらに、CIGMOを用い、swappingやinterpolation, random generationなどの、画像生成タスクを行い、定性的に期待する動作を確認した。
|
Research Progress Status |
令和2年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和2年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(9 results)