• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

機械学習における学習の停滞現象と損失関数の極値の安定性

研究課題

研究課題/領域番号 21500222
研究機関東海大学

研究代表者

尾関 智子  東海大学, 情報理工学部, 教授 (10407992)

研究期間 (年度) 2009-04-01 – 2014-03-31
キーワード機械学習 / 特異点 / ニューラルネットワーク / ダイナミクス / 強化学習 / 国際情報交換
研究概要

機械学習は,人間の脳のように外界から与えられたデータを学習することができるシステムを構築するための基礎理論である.学習を実現するアルゴリズムは,教師あり学習,教師なし学習,強化学習の3つに大きく分類することができる.本年度はこれらのアルゴリズムの学習ダイナミクスに注目して研究を進めた.まず強化学習では,動的な環境に適応する理論であるConcurrent Q-Learningの問題点を指摘し,改良を行った.Concurrent Q-Learningは,迷路問題においてゴールが変化したり,障害物が発生したりする場合にも適応的にゴールまでの最短経路を発見することのできるアルゴリズムとして提案された.しかし,Relaxationという処理が不十分であり,環境変化後にいったん見つけた最短経路を見失ってしまうため,その改良方法を提案した.また,RelaxationとNow Update Traceを同時にもちいることは困難であることを示した.教師なし学習のダイナミクスについては,色画像処理におけるk-means法においてそのダイナミクスの研究を行った.最後に,教師あり学習では,階層構造をもつ隠れマルコフモデルにおいて,遷移確率行列が特異な性質をもつときパラメータが同定不能となり,ダイナミクスに奇妙な振る舞いが見られる.昨年度に引き続き,学習ダイナミクスにおいてパラメータの軌跡がつねにある曲線に引き込まれる様子をシミュレーションで示したが,その原因の理論的解明には至らなかった.

現在までの達成度 (区分)
理由

25年度が最終年度であるため、記入しない。

今後の研究の推進方策

25年度が最終年度であるため、記入しない。

  • 研究成果

    (5件)

すべて 2014 2013

すべて 雑誌論文 (2件) (うち査読あり 1件) 学会発表 (3件)

  • [雑誌論文] Concurrent Q LearningにおけるRelaxationの改良2013

    • 著者名/発表者名
      村上和謙, 尾関智子
    • 雑誌名

      東海大学紀要情報理工学部

      巻: 13 ページ: 9-14

    • 査読あり
  • [雑誌論文] Improvement of the Relaxation Procedure in Concurrent Q-Learning2013

    • 著者名/発表者名
      Kazunori Murakami, Tomoko Ozeki
    • 雑誌名

      Neural Information Processing Lecture Notes in Computer Science

      巻: 8227 ページ: 84-91

    • DOI

      10.1007/978-3-642-42042-9_11

  • [学会発表] Concurrent_Q-Learningにおける適格度トレースの影響2014

    • 著者名/発表者名
      村上和謙,尾関智子
    • 学会等名
      電子情報通信学会 総合大会
    • 発表場所
      新潟大学
    • 年月日
      20140318-20140321
  • [学会発表] 色情報を用いたk-means法による画像分類2014

    • 著者名/発表者名
      小島彩加,尾関智子
    • 学会等名
      電子情報通信学会 総合大会 ISS学生ポスターセッション
    • 発表場所
      新潟大学
    • 年月日
      20140318-20140321
  • [学会発表] Improvement of the Relaxation Procedure in Concurrent Q-Learning2013

    • 著者名/発表者名
      Kazunori Murakami, Tomoko Ozeki
    • 学会等名
      ICONIP 2013 secretariat, Brain Engineering Society of Korea
    • 発表場所
      Daegu, Korea
    • 年月日
      20131103-20131107

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi