• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実績報告書

機械学習における学習の停滞現象と損失関数の極値の安定性

研究課題

研究課題/領域番号 21500222
研究機関東海大学

研究代表者

尾関 智子  東海大学, 情報理工学部, 教授 (10407992)

研究期間 (年度) 2009-04-01 – 2014-03-31
キーワード機械学習 / 特異点 / ニューラルネットワーク / 国際情報交換
研究概要

機械学習は,内部にパラメータをもつ学習モデルを仮定し,外部から与えられる多数の学習データに潜む法則や数学的な構造を推論するものである.学習モデルが内部パラメータを変えることにより,望ましい出力を獲得していく過程を学習と呼ぶ.多層パーセプトロンでは学習が途中で停滞してしまう現象が多く見られる.これは,パラメータ空間の特異構造によるもので,より複雑な多層パーセプトロンのパラメータ空間の中に,単純な多層パーセプトロンと等価な領域が複雑に存在するためである.これまで,確率差分方程式の解が描く軌跡を解析し,損失関数の微分が零となる臨界点がMilnorタイプのアトラクターとなっていることを共同研究により示してきた.同じく階層構造をもつ隠れマルコフモデルにおいて,遷移確率行列が特異な性質をもつときパラメータが同定不能になり,ダイナミクスに奇妙な振る舞いが見られた.学習ダイナミクスにおいてパラメータの軌跡がつねにある曲線に引き込まれる様子をシミュレーションで示し,そのアトラクターの性質に関して解析中であるが,まだ解析的に明らかにするには至っておらず今後の課題である.
本年度から,Restriced Boltzmann Machineのダイナミクスの解析を始めた.ボルツマンマシンも階層構造をもつことが知られており,またRestricted Boltzmann Machineは現在盛んに研究がすすめられているDeep Leariningに用いられている.
また,大学院生との共同研究で環境の変化に即座に対応できる強化学習アルゴリズムのダイナミクスに関する研究を進めた.

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

隠れマルコフモデルの学習ダイナミクスに関して,シミュレーション実験によりパラメータの軌跡を追うことはできているが,その軌跡の解析的な研究は,数学的な困難さもあり,大きな進展があったとは言い難い.解析のための研究時間が十分に取れず,今後はエフォートの割合を改善する必要がある.

今後の研究の推進方策

隠れマルコフモデルの学習ダイナミクスに関しては多くのシミュレーション実験を行ったが,確率差分方程式の解の挙動を解析的に明らかにするに至っていない.今年度は解析的な研究を行うための絶対的な時間が十分に取れなかった.来年度は教育・研究・運営のエフォートの割合の見直しを図り,研究時間の確保に努めたい.
本年度の秋に韓国で開催される国際会議で成果発表を行う際に,韓国の共同研究者とRestricted Boltzmann Machineの学習ダイナミクスについて議論し,特異モデルのダイナミクスの研究を推進していく.
大学院生との共同研究である強化学習のダイナミクスについてもさらに研究を進めていく.

  • 研究成果

    (3件)

すべて 2013 2012

すべて 雑誌論文 (1件) 学会発表 (2件)

  • [雑誌論文] Concurrent Q learningにおけるrelaxationの改良2012

    • 著者名/発表者名
      村上和謙,尾関智子(代表者)
    • 雑誌名

      信学技報

      巻: vol. 112, No. 480 ページ: 209-213

  • [学会発表] Concurrent Q learningにおけるrelaxationの改良2013

    • 著者名/発表者名
      村上和謙,尾関智子(代表者)
    • 学会等名
      電子情報通信学会 ニューロコンピューティング研究会
    • 発表場所
      玉川大学
    • 年月日
      20130313-20130315
  • [学会発表] Concurrent Q LearningとSarsa、Q学習の動的環境への適応能力2012

    • 著者名/発表者名
      村上和謙,尾関智子(代表者)
    • 学会等名
      第15回情報論的学習理論ワークショップ(IBIS2012)
    • 発表場所
      筑波大学東京キャンパス
    • 年月日
      20121107-20121109

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi