機械学習は,人間の脳のように外界から与えられたデータを学習することができるシステムを構築するための基礎理論である.学習を実現するアルゴリズムは,教師あり学習,教師なし学習,強化学習の3つに大きく分類することができる.本年度はこれらのアルゴリズムの学習ダイナミクスに注目して研究を進めた.まず強化学習では,動的な環境に適応する理論であるConcurrent Q-Learningの問題点を指摘し,改良を行った.Concurrent Q-Learningは,迷路問題においてゴールが変化したり,障害物が発生したりする場合にも適応的にゴールまでの最短経路を発見することのできるアルゴリズムとして提案された.しかし,Relaxationという処理が不十分であり,環境変化後にいったん見つけた最短経路を見失ってしまうため,その改良方法を提案した.また,RelaxationとNow Update Traceを同時にもちいることは困難であることを示した.教師なし学習のダイナミクスについては,色画像処理におけるk-means法においてそのダイナミクスの研究を行った.最後に,教師あり学習では,階層構造をもつ隠れマルコフモデルにおいて,遷移確率行列が特異な性質をもつときパラメータが同定不能となり,ダイナミクスに奇妙な振る舞いが見られる.昨年度に引き続き,学習ダイナミクスにおいてパラメータの軌跡がつねにある曲線に引き込まれる様子をシミュレーションで示したが,その原因の理論的解明には至らなかった.
|