研究領域 | 人工知能と脳科学の対照と融合 |
研究課題/領域番号 |
19H04982
|
研究種目 |
新学術領域研究(研究領域提案型)
|
配分区分 | 補助金 |
審査区分 |
複合領域
|
研究機関 | 電気通信大学 |
研究代表者 |
庄野 逸 電気通信大学, 大学院情報理工学研究科, 教授 (50263231)
|
研究期間 (年度) |
2019-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2020年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2019年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
|
キーワード | 深層学習 / テクスチャ特徴 / Portilla Simoncelli 特徴 / V4視覚野 / 画像生成 / テクスチャ特徴量 / 特徴量解析 / 畳み込みニューラルネットワーク / テクスチャ表現 / PSS |
研究開始時の研究の概要 |
深層学習と心理物理量とのマッピングを行っていく.畳み込みニューラルネットワークに代表される深層学習は画像タスクに関して,性能を示すことに成功しているが,どのような特徴を抽出していて,それが人間の質感認知とどのような関係にあるのかは未だ明らかではない.本研究では,これらをつなぐためのアプローチとしてテクスチャを表す心理特徴量とCNNの内部表現との比較を行い,これらの関連性を明らかにすることを試みる.
|
研究実績の概要 |
深層畳み込みニューラルネットワーク(Deep Convoution Neural Network: DCNN) は,人間の視覚系をヒントに構築されているが,“どのような特徴を抽出しているのか?”,“人間の知覚とどのように関係しているのか?” といった問いに対する議論は不十分であった.令和2年度の研究としては,DCNN の内部表現に着目し,心理物理的な意味でのテクスチャ特徴量が,どの程度使用されているかの頻度を調査し,どの程度,生体の視覚系と類似しているかの解析を行った. 心理物理的な特徴量としては Portilla-Simoncelli 特徴量 (PSS) を用いた.DCNNとしてはビルディングブロック構造がシンプルなVGGを採用し,自然画像を識別するのに最適化されたものを用いている.テクスチャデータとしては,サルの視覚系との比較が行えるように Okazaki Synthetic Texture Image を用いて解析を行った.解析は,テクスチャ画像をVGGに与えた際に,各階層から得られる反応をもとにPSSへのスパース回帰を行った. VGGの初期層は,比較的単純な統計量であるスペクトル統計などが強く関連するが,高次層に至るにつれ,特徴間の相互相関的な特徴量との関連度が高くなることが確認された.これはサルV4野等で得られた実験とも整合するため,自然画像のパターン認識が目的で構築された VGG であっても,テクスチャを表現するような情報を視覚系と類似した形態で保持していることが示唆できた.またVGGを用いた Style Transfer モデルで画像を生成した場合,視認的な意味とPSS的な意味において,かなり類似した画像を生成できることからVGGは潜在的にテクスチャを表現するのに適したモデルであることを確認した.
|
現在までの達成度 (段落) |
令和2年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和2年度が最終年度であるため、記入しない。
|