Publicly Offered Research
Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
深層学習と心理物理量とのマッピングを行っていく.畳み込みニューラルネットワークに代表される深層学習は画像タスクに関して,性能を示すことに成功しているが,どのような特徴を抽出していて,それが人間の質感認知とどのような関係にあるのかは未だ明らかではない.本研究では,これらをつなぐためのアプローチとしてテクスチャを表す心理特徴量とCNNの内部表現との比較を行い,これらの関連性を明らかにすることを試みる.
深層畳み込みニューラルネットワーク(Deep Convoution Neural Network: DCNN) は,人間の視覚系をヒントに構築されているが,“どのような特徴を抽出しているのか?”,“人間の知覚とどのように関係しているのか?” といった問いに対する議論は不十分であった.令和2年度の研究としては,DCNN の内部表現に着目し,心理物理的な意味でのテクスチャ特徴量が,どの程度使用されているかの頻度を調査し,どの程度,生体の視覚系と類似しているかの解析を行った.心理物理的な特徴量としては Portilla-Simoncelli 特徴量 (PSS) を用いた.DCNNとしてはビルディングブロック構造がシンプルなVGGを採用し,自然画像を識別するのに最適化されたものを用いている.テクスチャデータとしては,サルの視覚系との比較が行えるように Okazaki Synthetic Texture Image を用いて解析を行った.解析は,テクスチャ画像をVGGに与えた際に,各階層から得られる反応をもとにPSSへのスパース回帰を行った.VGGの初期層は,比較的単純な統計量であるスペクトル統計などが強く関連するが,高次層に至るにつれ,特徴間の相互相関的な特徴量との関連度が高くなることが確認された.これはサルV4野等で得られた実験とも整合するため,自然画像のパターン認識が目的で構築された VGG であっても,テクスチャを表現するような情報を視覚系と類似した形態で保持していることが示唆できた.またVGGを用いた Style Transfer モデルで画像を生成した場合,視認的な意味とPSS的な意味において,かなり類似した画像を生成できることからVGGは潜在的にテクスチャを表現するのに適したモデルであることを確認した.
令和2年度が最終年度であるため、記入しない。
All 2021 2020 2019
All Journal Article (5 results) (of which Peer Reviewed: 5 results, Open Access: 2 results) Presentation (10 results) (of which Int'l Joint Research: 6 results) Book (1 results) Patent(Industrial Property Rights) (2 results)
Journal of the Physical Society of Japan
Volume: 90 Issue: 4 Pages: 044705-044705
10.7566/jpsj.90.044705
40022539093
Science and Technology of Advanced Materials
Volume: 21 Issue: 1 Pages: 402-419
10.1080/14686996.2020.1773210
Journal of Electron Spectroscopy and Related Phenomena
Volume: 245 Pages: 147003-147003
10.1016/j.elspec.2020.147003
Medical Imaging Technology
Volume: 37 Issue: 5 Pages: 217-229
10.11409/mit.37.217
130007752682
情報処理学会論文誌数理モデル化と応用
Volume: 12 Pages: 68-77
170000181266