2013 Fiscal Year Annual Research Report
機械学習における学習の停滞現象と損失関数の極値の安定性
Project/Area Number |
21500222
|
Research Institution | Tokai University |
Principal Investigator |
尾関 智子 東海大学, 情報理工学部, 教授 (10407992)
|
Project Period (FY) |
2009-04-01 – 2014-03-31
|
Keywords | 機械学習 / 特異点 / ニューラルネットワーク / ダイナミクス / 強化学習 / 国際情報交換 |
Research Abstract |
機械学習は,人間の脳のように外界から与えられたデータを学習することができるシステムを構築するための基礎理論である.学習を実現するアルゴリズムは,教師あり学習,教師なし学習,強化学習の3つに大きく分類することができる.本年度はこれらのアルゴリズムの学習ダイナミクスに注目して研究を進めた.まず強化学習では,動的な環境に適応する理論であるConcurrent Q-Learningの問題点を指摘し,改良を行った.Concurrent Q-Learningは,迷路問題においてゴールが変化したり,障害物が発生したりする場合にも適応的にゴールまでの最短経路を発見することのできるアルゴリズムとして提案された.しかし,Relaxationという処理が不十分であり,環境変化後にいったん見つけた最短経路を見失ってしまうため,その改良方法を提案した.また,RelaxationとNow Update Traceを同時にもちいることは困難であることを示した.教師なし学習のダイナミクスについては,色画像処理におけるk-means法においてそのダイナミクスの研究を行った.最後に,教師あり学習では,階層構造をもつ隠れマルコフモデルにおいて,遷移確率行列が特異な性質をもつときパラメータが同定不能となり,ダイナミクスに奇妙な振る舞いが見られる.昨年度に引き続き,学習ダイナミクスにおいてパラメータの軌跡がつねにある曲線に引き込まれる様子をシミュレーションで示したが,その原因の理論的解明には至らなかった.
|
Current Status of Research Progress |
Reason
25年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
25年度が最終年度であるため、記入しない。
|
Research Products
(5 results)