• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

データ同化強化学習

研究課題

研究課題/領域番号 25730135
研究種目

若手研究(B)

配分区分基金
研究分野 知能情報学
研究機関東京大学 (2015)
大阪大学 (2013-2014)

研究代表者

植野 剛  東京大学, 新領域創成科学研究科, 特任研究員 (90615824)

研究期間 (年度) 2013-04-01 – 2016-03-31
研究課題ステータス 完了 (2015年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2015年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2014年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2013年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード強化学習 / データ同化 / 機械学習 / 人工知能 / ベイズ最適化 / 創薬 / 確率最適制御 / 最適制御 / 統計学習
研究成果の概要

計算機シミュレーションの結果から行動戦略を学習することは,多大なコストが発生する「実験」を行なう必要がないため,飛躍的な生産性の向上が見込まれる. しかし,シミュレーションの結果は実際の実験結果から乖離することも少なくなく,シミュレーションで得た戦略が実際に意味をなさないことも多い.本研究では,シミュレーション学習の枠組みであるデータ同化と,データから意思決定則を学習する強化学習を組み合わせた「データ同化強化学習」を開発し,少ない実験数で高い性能を発揮する行動戦略の学習を実現した.また,開発した手法を新規材料設計問題に応用し,従来法より少ない実験数で目標とする物質を見つけることに成功した.

報告書

(4件)
  • 2015 実績報告書   研究成果報告書 ( PDF )
  • 2014 実施状況報告書
  • 2013 実施状況報告書
  • 研究成果

    (8件)

すべて 2016 2014 2013 その他

すべて 国際共同研究 (1件) 雑誌論文 (3件) (うち国際共著 1件、 査読あり 2件、 オープンアクセス 1件、 謝辞記載あり 1件) 学会発表 (4件) (うち招待講演 2件)

  • [国際共同研究] Trevor David Rhoneb/Harvard University(米国)

    • 関連する報告書
      2015 実績報告書
  • [雑誌論文] COMBO: An Efficient Bayesian Optimization Library for Materials Science Materials Discovery2016

    • 著者名/発表者名
      Tsuyoshi Ueno, Trevor David Rhone, T. Mizoguchi, Zhufeng Hou Koji Tsuda
    • 雑誌名

      Materials Discovery

      巻: 印刷中

    • 関連する報告書
      2015 実績報告書
    • 査読あり / オープンアクセス / 国際共著 / 謝辞記載あり
  • [雑誌論文] 極大クリーク列挙技術のビジネス応用と ソフトウェアツール2014

    • 著者名/発表者名
      植野剛
    • 雑誌名

      電子情報通信学会誌,

      巻: 92 ページ: 1103-1106

    • 関連する報告書
      2014 実施状況報告書
  • [雑誌論文] Active learning for noisy oracle via density power divergence2013

    • 著者名/発表者名
      Y. Sogawa, T. Ueno, Y. Kawahara, T. Washio,
    • 雑誌名

      Neural Networks

      巻: 46 ページ: 133-143

    • 関連する報告書
      2013 実施状況報告書
    • 査読あり
  • [学会発表] 確率推論による方策探索法2014

    • 著者名/発表者名
      植野 剛
    • 学会等名
      日本ロボット学会 学術講演会
    • 発表場所
      福岡県北九州市
    • 年月日
      2014-09-04 – 2014-09-06
    • 関連する報告書
      2014 実施状況報告書
  • [学会発表] e射影に基づく方策探索法2014

    • 著者名/発表者名
      植野 剛
    • 学会等名
      人工知能学会全国大会
    • 発表場所
      愛媛県松山市
    • 年月日
      2014-05-12 – 2014-05-15
    • 関連する報告書
      2014 実施状況報告書 2013 実施状況報告書
  • [学会発表] 学習による制御: 強化学習2013

    • 著者名/発表者名
      植野 剛
    • 学会等名
      計測・制御・システム工学部会シンポジウム
    • 発表場所
      千葉県千葉市
    • 関連する報告書
      2013 実施状況報告書
    • 招待講演
  • [学会発表] Semiparametric Statistical Inference to Reinforcement Leanrning2013

    • 著者名/発表者名
      Tsuyoshi Ueno
    • 学会等名
      Bernoulli Society Satellite Meeting to the ISI World Statistics Congress 2013
    • 発表場所
      東京都文京区
    • 関連する報告書
      2013 実施状況報告書
    • 招待講演

URL: 

公開日: 2014-07-25   更新日: 2022-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi