• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

ディープラーニングのホワイトボックス化に関する研究

Research Project

Project/Area Number 18H04106
Research InstitutionThe University of Tokyo

Principal Investigator

岡田 真人  東京大学, 大学院新領域創成科学研究科, 教授 (90233345)

Co-Investigator(Kenkyū-buntansha) 永田 賢二  国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 研究チーム長 (10556062)
楽 詠コウ  東京大学, 大学院新領域創成科学研究科, 助教 (30612923)
庄野 逸  電気通信大学, 大学院情報理工学研究科, 教授 (50263231)
Project Period (FY) 2018-04-01 – 2023-03-31
Keywordsニューラルネットワーク / 情報統計力学
Outline of Annual Research Achievements

ディープラーニング (DL)の最も大きな問題点は,その機能がブラックボックス化していることである.本研究課題では,DLの挙動を解明する情報数理学的枠組みの構築と,それを補完するデータ駆動型アプローチを構築する.
前者の具体的なアプローチとして,まず情報統計力学,統計神経力学,特異統計学など第二次ニューロブームを契機に発展した情報数理的な枠組みを現状のDL に適用する.本年度は,DLの学習の際に誤差が減少せずに長時間にわたり停滞する「プラトー現象」を取り扱った.プラトー現象の一因として,ニューラルネットワークの構造の対称性に由来する「特異領域」が誤差曲面上に存在し,この領域にネットワークの重みが捉われることが,様々な研究により指摘されてきた.しかしながら,既存の研究ではいずれも一次元の出力が仮定されており,複数次元の出力を行うネットワークは検討されてこなかった.本研究では,統計力学的定式化を用いて,複数個の出力素子をもつ三層パーセプトロンの学習ダイナミクスを解析した.具体的には,ニューラルネットワークの重みパラメータの巨視的な性質を捉えたオーダパラメータを定義し,高次元系である重みの更新則から,少変数系であるオーダパラメータ系の発展則(微分方程式)を導出した.オーダパラメータ系の解析により,出力が複数次元の場合には,特異領域由来のプラトー現象が軽減・消失することを示した.
また,解析的取り扱いができない DL に対して数値シミュレーションデータを機械学習で解析するデータ駆動型アプローチとして,本年度では,特に少数データセットという制限下における予測性能向上手法として,転移学習やデータ拡張などを用いて2つのCNNの入力反応を比較する手法の検討および,脳皮質における表現の連続性に基づいた解析を行なうことで,一定の成果を得た.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本研究課題ではDLの挙動を解明する情報数理学的枠組みの構築として,情報統計力学による情報数理的な枠組みを現状のDL に適用している.本年度は,DLの学習の際に誤差が減少せずに長時間にわたり停滞する「プラトー現象」を取り扱い,当初の予定どおり,複数個の出力素子をもつ三層パーセプトロンの学習ダイナミクスを解析によって,ニューラルネットワークの重みパラメータの巨視的な性質を捉えたオーダパラメータを定義し,高次元系である重みの更新則から,少変数系であるオーダパラメータ系の発展則(微分方程式)を導出することができた.それにより,オーダパラメータ系の解析により,出力が複数次元の場合には,特異領域由来のプラトー現象が軽減・消失することをしただけでなく,重みの直交初期化を行った場合には学習中に特異領域への接近が生じないことを,理想的な系において理論的に示すことができた.以上の成果から,当初の計画以上に進展していると判断した.

Strategy for Future Research Activity

DLの挙動を解明するため必要な高次元データの解析を,情報統計力学的に低次元に縮約して,今後も理論研究を推進する.そのために,今後は Layer Normalization と呼ばれる各中間層内の活動を正規化するアルゴリズムの挙動を明らかにする.また,本年度で取り扱ったプラトー現象を回避できるためのデータセットの統計的性質を,統計力学的手法により明らかにする.
さらに,これまで扱ったDLの一種である入力から出力に一方向に情報処理が進むフィードフォワード型多層パーセプトロンだけではなく,フィードバック結合により入力画像の再構成をする生成モデル型のもの(以下,DGM,Deep Generative Model:深層生成モデルと呼ぶ)についても解析を行う そこで,特異統計学で利用される実対数的閾値(RLCT)に着目し,モンテカルロ法を援用することで,機械学習において重要な与えられたデータとDNNのモデルで決まる誤差関数を最小にするパラメータ集合の複雑さを,RLCTにより評価することを目指す.

  • Research Products

    (13 results)

All 2019 2018

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (11 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Statistical mechanical analysis of learning dynamics of two-layer perceptron with multiple output units2019

    • Author(s)
      Yuki Yoshida, Ryo Karakida, Masato Okada and Shun-ichi Amari
    • Journal Title

      Journal of Physics A: Mathematical and Theoretical

      Volume: 52 Pages: 1-17

    • DOI

      10.1088/1751-8121/ab0669

    • Peer Reviewed / Open Access
  • [Journal Article] Feature Representation Analysis of Deep Convolutional Neural Network using Two-stage Feature Transfer―An Application for Diffuse Lung Disease Classification2018

    • Author(s)
      Aiga Suzuki, Hidenori Sakanashi, Shoji Kido, Hayaru Shouno
    • Journal Title

      情報処理学会論文誌数理モデル化と応用(TOM)

      Volume: 11 Pages: 74-83

    • Peer Reviewed
  • [Presentation] VGGモデルの視覚野的解釈における解析の検討2019

    • Author(s)
      寺元 陶冶,庄野 逸
    • Organizer
      電子情報通信学会ニューロコンピューティング研究会
  • [Presentation] テクスチャ画像識別問題に対するフーリエ変換を用いたデータ拡張の検討2019

    • Author(s)
      新田 大悟,庄野 逸
    • Organizer
      電子情報通信学会ニューロコンピューティング研究会
  • [Presentation] SVCCAを用いた異なるデータセットで訓練されたDCNNの類似性測定2019

    • Author(s)
      寺元 陶冶,庄野 逸
    • Organizer
      電子情報通信学会ニューロコンピューティング研究会
  • [Presentation] Layer Normalizationが単層パーセプトロンに与える影響の統計力学的解析2019

    • Author(s)
      高木志郎,吉田雄紀,岡田真人
    • Organizer
      日本物理学会第74回年次大会
  • [Presentation] 交換モンテカルロ法を用いたイジングモデルパラメータの信頼度付き推定2019

    • Author(s)
      大日方 孝輝,片上 舜,楽 詠こう,岡田 真人
    • Organizer
      日本物理学会第74回年次大会
  • [Presentation] レプリカ交換モンテカルロ法を用いたMixture of Expertsモデルにおけるベイズ推論2019

    • Author(s)
      松平京介,永田賢二,本武陽一,岡田真人
    • Organizer
      情報処理学会 数理モデル化と問題解決(MPS)研究会
  • [Presentation] Mosquito Larva Classification based on a Convolution Neural Network2018

    • Author(s)
      Alejandra Sanchez, Mariko Nakano, Henrik Tunnermann, Toya Teramoto, Hayaru Shouno
    • Organizer
      International Conference on Parallel Distributed Processing Techniques and Applications (PDPTA) 2018
    • Int'l Joint Research
  • [Presentation] 問題への適切性を考慮した畳み込みニューラルネットワークの初期値決定手法2018

    • Author(s)
      鈴木 藍雅,庄野 逸,坂無 英徳
    • Organizer
      情報処理学会数理モデル化と問題解決研究会
  • [Presentation] Layer Normalization を用いた単層パーセプトロンの統計力学的解析2018

    • Author(s)
      高木志郎,吉田雄紀,岡田真人
    • Organizer
      第21回情報論的学習理論ワークショップ
  • [Presentation] 交換モンテカルロ法を用いた二値画像に対するハイパーパラメータ分布推定2018

    • Author(s)
      大日方 孝輝,片上 舜,楽 詠こう,岡田 真人
    • Organizer
      電子情報通信学会 情報論的学習理論と機械学習研究会(IBISML)
  • [Presentation] 混合正規分布モデルにおけるベイズ推定と変分ベイズ推定の比較2018

    • Author(s)
      中山智文,藤井直樹,永田賢二,岡田真人
    • Organizer
      第21回情報論的学習理論ワークショップ

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi