2003 Fiscal Year Annual Research Report
ひらめきに見るヒトの事前知識利用メカニズムの解明とマシンラーニングの高速化
Project/Area Number |
15700117
|
Research Institution | Hokkaido University |
Principal Investigator |
山内 康一郎 北海道大学, 大学院・工学研究科, 助教授 (00262949)
|
Keywords | 神経回路 / GRBF / モデル選択 / ひらめき / reactive learning(即時学習) / 強化学習 / 勘に基づく学習 / 追加学習 / 心理実験 |
Research Abstract |
学習機械を利用した知識抽出手法の多くは、適当な初期解を正解へと徐々に近付けて行くため、非常に長い時間がかかる。一方ヒトは、学習機械に比べて圧倒的に少ないデータを見ただけで閃くように解を発見することが多い。本年度はこれを心理実験で調査し、そこから得られた知見をヒントにした学習システムを構築し、その動作を確認した。 心理学的知見 ヒトの規則発見過程を調査するため、環を描くように配置された大きさの異なる5個の円と、その中心付近に描かれた1個の円を大きさを変えながら25名の被験者に提示した。ただし5つの円のうち2つの円の大きさと中心の円の大きさにのみ関係がありその他の円には無関係である。25名の被験者うちの何名かにはヒントが与えられる。その結果、1.ヒントを与えられたグループは速く規則が発見できる。 2.幾つかの候補を同時に評価しており、一つの候補に着目してそれに小規模な更新を繰り返すが、うまく行かない場合は全く別候補に突然移る。 という結果が得られた。ここからヒトは事前知識を使って複数の候補を生成し、それら候補を渡り歩くように解を探すと推察された。 即時学習モデル 以上の結果を踏まえ、即時学習モデルを2つ構築した。一つは学習経験を事前知識とし貯えるべく、学習時のパラメータ変化量を学習して次回からの学習に利用するモデル。もう一つは、過去の学習結果をNeural Gasの各々のもジュールとして保持し、これを次回からの学習パラメータの初期値として利用するものである。前者はカオス時系列の学習タスク等、似たようなパターンの学習を繰り返すもの、そして後者は似たような関数形状を学習することを前提としている。予備実験の結果、これらのシステムが従来よりも圧倒的に少ないサンプル数で学習することを確認した。これらのシステムは緊急を要する状況での利用に特に有用である。 従来型学習法(強化学習法とonline学習法)の高速化 上記と同様に過去の学習結果から内部に知識を貯えることで、新しいタスクにたいして高速に強化学習を行うシステムを提案すると共に、カルマンフィルターによる高速なモデル選択付きonline学習法を提案した。
|
Research Products
(10 results)
-
[Publications] 森, 山内, 石川, 大森: "モデル選択問題に対する人間の解発見方略のモデル化及びマルチエージェント環境への適用"電子情報通信学会技術報告. NC2002-191. 107-112 (2003)
-
[Publications] 大平, 山内, 大森: "メタ学習による追加学習の高速化"電子情報通信学会技術報告. NC2002-193. 119-124 (2003)
-
[Publications] 山内: "睡眠期間を導入したモデル選択付追加学習"電子情報通信学会技術報告. NC2002-192. 113-118 (2003)
-
[Publications] T.Oohira, K.Yamauchi, T.Omori: "Meta-learning for Fast Incremental Learning"ICANN/ICONIP 2003 LNCS2714. 157-164 (2003)
-
[Publications] K.Yamauchi: "Incremental Learning with Sleep -Application for Predicting Posterior Distribution-"International Joint Conference on Neural Networks, IJCNN2003. Vol.4. 2776-2781 (2003)
-
[Publications] 近藤, 山内, 大森: "マルチタスク学習効率化のためのサブゴール発見法"FIT(情報科学技術フォーラム)2003. 355-356 (2003)
-
[Publications] 西田, 山内, 大森: "Minimal Hyper Basis Function Networksを用いた逐次学習法"IBIS2003第6回情報論的学習理論ワークショップ. 211-216 (2003)
-
[Publications] 大平, 山内, 大森: "メタ学習による追加学習の高速化"FIT(情報科学技術フォーラム)2003. 467-468 (2003)
-
[Publications] K.Yamauchi, T.Oohira, T.Omori: "Fast Incremental Learning Methods Inspired by Biological Learning Behevior"International Symposium on Artificial Life and Robotics (AROB). Vol.1. 341-346 (2004)
-
[Publications] K.Kondo, K.Yamauchi, T.Omori: "A sub-goal adaptation method for quick reinforcement learning in varied environments"International Symposium on Artificial Life and Robotics (AROB). Vol.1. 317-320 (2004)