研究課題/領域番号 |
23300055
|
研究機関 | 電気通信大学 |
研究代表者 |
西野 哲朗 電気通信大学, 情報理工学(系)研究科, 教授 (10198484)
|
研究分担者 |
保木 邦仁 電気通信大学, 先端領域教育研究センター, 助教 (00436081)
山崎 匡 電気通信大学, 情報理工学(系)研究科, 助教 (40392162)
田中 繁 電気通信大学, 総合コミュニケーション科学推進室, 教授 (70281706)
|
研究期間 (年度) |
2011-04-01 – 2014-03-31
|
キーワード | 脳科学 / 計算論的学習 / 記憶 / 運動 / 思考 |
研究概要 |
小型ヒューマノイドが比較的安価に購入できるようになり、普及が進んでいる。小型ヒューマノイドの制御は通常、各関節のサーボモータの角度を直接記述することで行われているが、これは大変煩雑な作業であり、思い通りの動作を作成することが難しい。一方、生物の運動制御は階層化されている。前頭皮質において目標を-設定すると、その目標を遂行するための運動計画が高次運動野・基底核においてなされ、必要な運動パターンが選択される。この運動パターンは抽象度の高い高次元のものである。高次運動パターンは一次運動野に記憶されている複数のより低次で単純な運動パターンに分解され、小脳によるゲイン・タイミング制御のもとで、運動指令へと変換される。運動指令は脊髄を介して筋肉へ到達し、筋肉が緊張して実際の運動が行われる。運動の結果は感覚器官からのフィードバックを介して再び脳へと戻って来る。このような生物の運動制御と比較すると、小型ヒューマノイドのそれは筋張力を直接記述していることに対応し、記述の抽象度が低すぎることがわかる。本研究では、生物の運動制御を模倣して、小型ヒューマノイドのそれを階層化することに成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
まず最初に、大脳皮質前頭葉、大脳基底核(線条体、淡蒼球, 視床下核, 黒質)並びに視床を含む大規模なニューラルネットワークモデルを構築した。特に、線条体ニューロンは、二相性の膜電位を呈する2-state model を用いて、非線形なゲート作用を表現した。また、多腕バンディット問題に対するε-GREEDY と呼ばれるアルゴリズムに着目し、モンテカルロ・アルゴリズムの制御にε-GREEDYを使用して、より強い大貧民アルゴリズムを得る(人間のプレイの知識を獲得する)ことに成功した。ここで、ε-GREEDY とは、スロットマシンの選択時点において、期待値が最大のスロットマシンをある確率でランダムに選択するアルゴリズムである。ε-GREEDY を用いると、最善でないスロットマシンを選択する確率を、 UCB1 の場合よりも、かなり小さな確率に抑えられることが知られている。
|
今後の研究の推進方策 |
脳機能のシミュレーションを有効に行うには、脳機能の適切なモデルを構成し、その動作原理を定義しなければならない。本研究では、そのようなモデル構築を体系的に行うために、計算論的学習理論を基盤として、運動、思考、記憶に関する以下の網羅的事例研究を行っていく。運動:ロボット動作の規則を状態遷移機械として学習し、得られた状態遷移機械によってロボット動作をシミュレーションする。記憶:脳のワーキングメモリのニューラルネットモデルを構成し、現実に即した動作を行わせる。思考:カードゲームのプレイの戦略をモンテカルロ法によって学習し、報酬を最大化するアルゴリズムによってプレイする。これらの方法論の性質、効果を比較検討し、相互補完させることで、計算論的学習理論に基づく脳機能シミュレーションの方法論を確立していく。
|