• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

帰納的強化学習の計算理論~環境の探索と帰納的再構成のベイズ推定

研究課題

研究課題/領域番号 20700126
研究機関東京大学

研究代表者

牧野 貴樹  東京大学, 総括プロジェクト機構, 特任助教 (20418651)

キーワード強化学習 / ノンパラメトリックベイズ / 隠れマルコフモデル / 階層的クラスタリング / 中華料理店過程 / サンプリング法
研究概要

今年度は、ノンパラメトリックベイズモデルを利用した強化学習研究のための拡張のステップとして2つの研究を行った。ひとつは、隠れマルコフモデル(HMM)における状態を階層的にクラスタリングする手法である。研究においては自然言語を対象にしてモデルの正当性を示したが、同様のモデルは、強化学習で扱うような複雑な環境をより効果的に学習するために有効な方法のひとつであると考えられる。もうひとつはHMMのノンパラメトリックベイズモデルのような、階層化された中華料理店過程からの複数の抽出の同時分布を適切に扱うためのサンプリング法の開発である。この方法により、より複雑なモデルを構築した場合でも適切なモデル推定が可能になることから、今後、ノンパラメトリックベイズ手法による強化学習を実現する際に有効であると考えられる。

  • 研究成果

    (6件)

すべて 2010 2009

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)

  • [雑誌論文] Proto-predictive representation of states with simple recurrent temporal-difference networks2009

    • 著者名/発表者名
      牧野貴樹
    • 雑誌名

      Proceedings of the 26th Annual international conference on machine learning 26

      ページ: 697-704

    • 査読あり
  • [雑誌論文] コミュニケーションの自己組織化2009

    • 著者名/発表者名
      牧野貴樹
    • 雑誌名

      自己組織化ハンドブック(NTS出版)

      ページ: 438-443

    • 査読あり
  • [学会発表] 隠れマルコフモデルのノンパラメトリックベイズ推定とMCMC法2010

    • 著者名/発表者名
      牧野貴樹
    • 学会等名
      研究会『マルコフ連鎖モンテカルロ法とその周辺』
    • 発表場所
      統計数理研究所(立川市)
    • 年月日
      2010-02-21
  • [学会発表] Conditional simultaneous draws from hierarchical chinese restaurant processes2009

    • 著者名/発表者名
      Takaki Makino, Shunsuke Takei, Daichi Mochihashi, Issei Sato, Toshihisa Takagi
    • 学会等名
      Nonparametric Bayes Workshop at NIPS 2009(NPBayes 2009)
    • 発表場所
      Whistler, BC, Canada
    • 年月日
      2009-12-11
  • [学会発表] ベイズ確率文脈自由文法のための高速構文木サンプリング法2009

    • 著者名/発表者名
      武井俊祐, 牧野貴樹, 高木利久
    • 学会等名
      情報論的学習理論(IBIS)2009
    • 発表場所
      九州大学(福岡市)
    • 年月日
      2009-10-19
  • [学会発表] 階層状態無限隠れマルコフモデル2009

    • 著者名/発表者名
      牧野貴樹
    • 学会等名
      情報論的学習理論(IBIS)2009
    • 発表場所
      九州大学(福岡市)
    • 年月日
      2009-10-19

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi