2013 Fiscal Year Annual Research Report

機械学習における学習の停滞現象と損失関数の極値の安定性

Research Project

Project/Area Number	21500222
Research Institution	Tokai University
Principal Investigator	尾関智子東海大学, 情報理工学部, 教授 (10407992)
Project Period (FY)	2009-04-01 – 2014-03-31
Keywords	機械学習 / 特異点 / ニューラルネットワーク / ダイナミクス / 強化学習 / 国際情報交換
Research Abstract	機械学習は，人間の脳のように外界から与えられたデータを学習することができるシステムを構築するための基礎理論である．学習を実現するアルゴリズムは，教師あり学習，教師なし学習，強化学習の3つに大きく分類することができる．本年度はこれらのアルゴリズムの学習ダイナミクスに注目して研究を進めた．まず強化学習では，動的な環境に適応する理論であるConcurrent Q-Learningの問題点を指摘し，改良を行った．Concurrent Q-Learningは，迷路問題においてゴールが変化したり，障害物が発生したりする場合にも適応的にゴールまでの最短経路を発見することのできるアルゴリズムとして提案された．しかし，Relaxationという処理が不十分であり，環境変化後にいったん見つけた最短経路を見失ってしまうため，その改良方法を提案した．また，RelaxationとNow Update Traceを同時にもちいることは困難であることを示した．教師なし学習のダイナミクスについては，色画像処理におけるk-means法においてそのダイナミクスの研究を行った．最後に，教師あり学習では，階層構造をもつ隠れマルコフモデルにおいて，遷移確率行列が特異な性質をもつときパラメータが同定不能となり，ダイナミクスに奇妙な振る舞いが見られる．昨年度に引き続き，学習ダイナミクスにおいてパラメータの軌跡がつねにある曲線に引き込まれる様子をシミュレーションで示したが，その原因の理論的解明には至らなかった．
Current Status of Research Progress	Reason 25年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	25年度が最終年度であるため、記入しない。

Research Products
(5 results)

All 2014 2013

All Journal Article (2 results) (of which Peer Reviewed: 1 results) Presentation (3 results)

[Journal Article] Concurrent Q LearningにおけるRelaxationの改良2013
- Author(s)
  村上和謙, 尾関智子
- Journal Title
  
  東海大学紀要情報理工学部
  
  Volume: 13 Pages: 9-14
- Peer Reviewed
[Journal Article] Improvement of the Relaxation Procedure in Concurrent Q-Learning2013
- Author(s)
  Kazunori Murakami, Tomoko Ozeki
- Journal Title
  
  Neural Information Processing Lecture Notes in Computer Science
  
  Volume: 8227 Pages: 84-91
- DOI
  10.1007/978-3-642-42042-9_11
[Presentation] Concurrent_Q-Learningにおける適格度トレースの影響2014
- Author(s)
  村上和謙，尾関智子
- Organizer
  電子情報通信学会　総合大会
- Place of Presentation
  新潟大学
- Year and Date
  20140318-20140321
[Presentation] 色情報を用いたk-means法による画像分類2014
- Author(s)
  小島彩加，尾関智子
- Organizer
  電子情報通信学会　総合大会　ISS学生ポスターセッション
- Place of Presentation
  新潟大学
- Year and Date
  20140318-20140321
[Presentation] Improvement of the Relaxation Procedure in Concurrent Q-Learning2013
- Author(s)
  Kazunori Murakami, Tomoko Ozeki
- Organizer
  ICONIP 2013 secretariat, Brain Engineering Society of Korea
- Place of Presentation
  Daegu, Korea
- Year and Date
  20131103-20131107

2013 Fiscal Year Annual Research Report

機械学習における学習の停滞現象と損失関数の極値の安定性

Principal Investigator

尾関 智子 東海大学, 情報理工学部, 教授 (10407992)

Reason

Research Products

[Journal Article] Concurrent Q LearningにおけるRelaxationの改良2013

Author(s)

Journal Title

[Journal Article] Improvement of the Relaxation Procedure in Concurrent Q-Learning2013

Author(s)

Journal Title

DOI

[Presentation] Concurrent_Q-Learningにおける適格度トレースの影響2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 色情報を用いたk-means法による画像分類2014

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Improvement of the Relaxation Procedure in Concurrent Q-Learning2013

Author(s)

Organizer

Place of Presentation

Year and Date

尾関智子東海大学, 情報理工学部, 教授 (10407992)