研究課題/領域番号 |
18H04106
|
研究機関 | 東京大学 |
研究代表者 |
岡田 真人 東京大学, 大学院新領域創成科学研究科, 教授 (90233345)
|
研究分担者 |
永田 賢二 国立研究開発法人物質・材料研究機構, 統合型材料開発・情報基盤部門, 主任研究員 (10556062)
楽 詠コウ 青山学院大学, 理工学部, 准教授 (30612923)
庄野 逸 電気通信大学, 大学院情報理工学研究科, 教授 (50263231)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | ディープラーニング / 情報統計力学 / データ駆動 |
研究実績の概要 |
学習済みの変分オートエンコーダー(VAE)は,ノイズが印加された画像の符号化と復号化を繰り返すこと(逐次的推論)で徐々にノイズが除去できることが知られていた.この推論を数回程度繰り返すことで生成画像の質が向上することが実験的には知られていたが,その背後のメカニズムは明らかでなかった.そこで本研究では,逐次的推論中の潜在空間での活動パターンの挙動を数値的に解析した.解析の結果,手書き数字の画像データを学習したVAEの推論の過程に,各数字に対応するクラスター中心への引き込みを示唆する結果が得られた.
深層畳み込みニューラルネット(以下DCNN)の内部表現の可視化ならびにテクスチャ表現に関わる特徴量の同定を行った.具体的な手法としては,テクスチャ入力画像をウェーブレット分解して得られる Portilla-Simoncelli 特徴量(以下PSS)と,DCNNの一種であるVGGの内部表現の間に対して回帰問題を設定し,PSS がどの程度DCNNの出力を説明できるかを定量化した.この結果,自然画像で学習させたVGG中間層においても,人工的なテクスチャを表すのに十分な情報をもち,サルのV4野におけるPSS表現の結果とも一定の類似度をもつことが確認できた.
画像や三次元物体,音を生成できる DGM を対象とし,潜在空間とデータ空間との写像関係における微分幾何的特徴を調べた.写像のヤコビ行列の特異値を調べると,特異値間には数桁の差があることが見られ,もっとも大きいオーダーの特異値は全体のうちの少数であった.この性質に着目して,特異値が大きい方向を重点的にユーザに開示することで,潜在空間が500次元のような高次元空間であっても,データ空間内での変化の大きい方向を効率よく探索できるユーザインタフェースを構成することができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
学習済みの変分オートエンコーダー(VAE)は,ノイズが印加された画像の符号化と復号化を繰り返すこと(逐次的推論)で徐々にノイズが除去できることが知られていた.この推論を数回程度繰り返すことで生成画像の質が向上することが実験的には知られていたが,その背後のメカニズムは明らかでなかった.そこで本研究では,逐次的推論中の潜在空間での活動パターンの挙動を数値的に解析した.解析の結果,手書き数字の画像データを学習したVAEの推論の過程に,各数字に対応するクラスター中心への引き込みを示唆する結果が得られた.逐次的推論によるノイズ除去の効果とクラスター中心への接近に相関が見られたことから,この現象がノイズ除去を引き起こしていることが示唆された.また,ノイズ除去のために必要な逐次的推論のステップ数の指針についての示唆が得られた.
電気生理学の先行研究により,サル脳の下側頭葉のニューロンは始めに大まかに顔を分類してから個体や表情を分類することが分かった.フィードフォワード深層ニューラルネットではこの時間経過を再現できないので,本研究では深層ネットとリカレントネットを組み合わせたモデルを構築した.その結果,異なったレベルのカテゴリーが異なる時間に出力した.これは,脳内のリカレント結合が階層的なカテゴリー分類に重要であることを示唆している.
これらの知見は,DGMのダイナミクスと側頭葉のニューロン集団のダイナミクスが深く関係していることを示唆する.
|
今後の研究の推進方策 |
人間は複数のタスクを順番に学習し,一度学習が完了したものに関してはすぐに忘れるということはない.人間が複数のタスクを順番に学習していく様に,複数のタスクを順番に学習する枠組みを継続学習という.モデルに複数のタスクを順番に学習させる継続学習をニューラルネットワークに行うと,最後に学習したタスク以外のタスクのパフォーマンスが急激に落ちる破滅的忘却が起こることが知られている.先行研究から破滅的忘却を支配する要素として入力空間の類似度・タスク間の類似度が重要であることが実験的・経験的に知られている.破滅的忘却を回避する手法は開発されている一方,破滅的忘却を統一的に議論する枠組みは確立されていないため,それぞれの要因が具体的にどのように破滅的忘却に影響を及ぼすか明らかでない.ここではタスクの類似度・入力空間の類似度を組み込んだ継続学習の単層線形の可解モデルを生徒教師学習・統計力学的定式化を用いてモデル化し解析する.汎化誤差の解析し,タスクの類似度と入力空間の類似度が破滅的忘却に対して相乗的に影響するかを示す.
深層ニューラルネットと脳の関係を調べるために,正立と倒立の顔画像に対するモデルの表現と,同じ画像を使用してサルの脳のTE野から記録したニューロン活動の表現を比較する.予備的な結果として,モデルの全結合層の表現がTE野のニューロンの表現に最も似ていることが分かり,正立顔の方が倒立顔より個体の分離が大きいという顔の倒立効果は,脳内のTE野で処理されている可能性を示唆する結果が得られている.今後はより詳細な比較を行う予定である.
|