研究領域 | 人工知能と脳科学の対照と融合 |
研究課題/領域番号 |
19H04999
|
研究種目 |
新学術領域研究(研究領域提案型)
|
配分区分 | 補助金 |
審査区分 |
複合領域
|
研究機関 | 株式会社国際電気通信基礎技術研究所 |
研究代表者 |
細谷 晴夫 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主任研究員 (50335296)
|
研究期間 (年度) |
2019-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
11,700千円 (直接経費: 9,000千円、間接経費: 2,700千円)
2020年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2019年度: 5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
|
キーワード | 機械学習 / 深層生成学習 / 恒常性 |
研究開始時の研究の概要 |
ワンショット学習は、脳の最も驚くべき汎化能力の一つである。例えば、顔画像を一例だけ覚えておくだけで、どの方向を向いた顔を見せられても認識できる。ワンショット学習は、人工知能分野でも時折取り上げられる難問であるが、決定的なアルゴリズムはまだなく、黎明期の技術である。本研究では、神経科学における高次視覚野の理論的・実験的知見と、深層生成学習という近年の機械学習技術を融合することにより、高性能なワンショット学習の人工実現を目指す。
|
研究実績の概要 |
前年度までgroup-based variational autoencoder (GVAE)を開発し、その上でワンショット学習の枠組みを考案した。今年度はさらに拡張して、高次視覚野の一般物体のモデルを深層学習モデルCIGMOを構築した。深層学習モデルGVAEの混合モデルとを考え、高次視覚野の物体のカテゴリに対応 して混合コンポネントを考えることにし、それぞれのコンポネントのGVAEが、各カテゴリの恒常的な表現となるようにした。このようなモデルを生成モデルとして定式し、VAE法で学習するアルゴリズムを構築した。ShapeNetデータセットを用いて、グループベースの学習で訓練した。隠れ変数としてカテゴリごとの恒常的な形状表現が得られるため、これを用いたワンショット学習を行い、定量的に性能測定をした。また、GVAEやMLVAE,VAEなどと比較したところ、性能で凌駕した。これにより、カテゴリ化により、表現がより特化し、それにより下流タスクの性能向上につながるという結果を得た。さらに、CIGMOを用い、swappingやinterpolation, random generationなどの、画像生成タスクを行い、定性的に期待する動作を確認した。
|
現在までの達成度 (段落) |
令和2年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和2年度が最終年度であるため、記入しない。
|