2009 年度実績報告書

部分観測マルコフ決定過程理論に基づく高次脳機能の自動的かつ高速な実装

研究課題

研究課題/領域番号	19700215
研究機関	佐賀大学
研究代表者	伊藤秀昭佐賀大学, 理工学部, 講師 (20345375)
キーワード	POMDP / 確率的最適制御 / 高次脳機能 / 推論 / 報酬最大化 / 適応制御 / 階層モデル / 階層制御
研究概要	本研究は、ゴール指向性推論・選択的注意・作業記憶の利用などの高次脳機能を的に実現するエージェントを設計することを目的としている。このような諸機能を設計者が作りこむのは容易ではなく、例えばいつ何に注意を向けるのがよいか、また、いつどのような推論をしたらよいかなどをあらかじめ設計者が決めておくのは困難である。そこで本研究では報酬最大化原理に基づきエージェントが環境にあわせて自動的に必要な機能を発現するように設計する。さらに、複雑な機能であっても現実的な時間内に発現できるよう、部分観測マルコフ決定過程理論に基づくモデル有り学習法を用いて高速な実装を目指す。以前の研究では、部分観測マルコフ決定過程理論に基づくモデル有り学習を可能とする既存の手法を実装し有効性を調べた。その結果、選択的注意および作業記憶の利用については簡単な問題を解くことに成功し、本研究のアプローチが有効であると確認することができた。しかしながら、ゴール指向性推論を含め、本研究が最終的に目的とするような複雑な機能を実現するためには既存手法では不足であり、より学習効率の高い手法が必要であることも明らかとなった。そこで本年度は、昨年度に続き、より高性能な手法の開発を進めた。特に、階層性を取り入れたモデル推定法およびその最適制御法を研究し、新たに開発した手法の性能を解析した。これにより、本手法がどのような場合に有効であるかを理論的に明らかにすることができた。今後はこの手法を具体的な問題に適用し上記の目的を達成したい。

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] Comparison of Near-Threshold Characteristics of Flash Suppression and Forward Masking2009
- 著者名/発表者名
  Kenji Aoki
- 学会等名
  International Conference on Neural Information Processing Bangkok, Thailand
- 発表場所
  Bangkok, Thailand
- 年月日
  2009-12-03