環境モデル徒弟学習の抜本的高速化技術の開発と実用的対話システムのプロトタイプ構築

研究課題

研究課題/領域番号	25730128
研究種目	若手研究(B)
配分区分	基金
研究分野	知能情報学
研究機関	東京大学
研究代表者	牧野貴樹東京大学, 生産技術研究所, 特任准教授 (20418651)
研究期間 (年度)	2013-04-01 – 2014-03-31
研究課題ステータス	中途終了 (2013年度)
配分額 *注記	4,160千円 (直接経費: 3,200千円、間接経費: 960千円) 2015年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2014年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円) 2013年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード	強化学習 / 逆強化学習 / 徒弟学習 / LUKE
研究概要	初年度の課題は、環境モデル徒弟学習を抜本的に高速化する技術を開発することであった。環境モデル徒弟学習においては、部分観測マルコフ決定過程の最適解計算を多数回実行する必要があり、計算速度が非常に遅いため、実用的な問題に適用することが不可能であり、高速化が不可欠な問題となっていた。本研究では、2つの手法、すなわち、方策の事後確率の列勾配計算による高速化と前回の解の再利用による高速化技術を開発し、実際に実装することで高速化を実現することができた。本研究で開発した技術は、オープンソースソフトウェア LUKE として一般に公開した。また、人工知能学会全国大会などで発表した。

報告書

(1件)

2013 実績報告書

研究成果
(8件)

すべて 2014 2013 その他

すべて雑誌論文 (3件) 学会発表 (4件) (うち招待講演 3件) 備考 (1件)

[雑誌論文] 実用化する強化学習技術2014
- 著者名/発表者名
  牧野貴樹
- 雑誌名
  
  生産研究
  
  巻: 66
- 関連する報告書
  2013 実績報告書
[雑誌論文] 自然言語処理における逆強化学習・模倣学習の適用2013
- 著者名/発表者名
  坪井祐太, 牧野貴樹
- 雑誌名
  
  計測と制御
  
  巻: 52 ページ: 922-927
- 関連する報告書
  2013 実績報告書
[雑誌論文] パネルティスカッション: 強化学習 @ 2025 A.D. - 10年後の強化学習が目指すもの2013
- 著者名/発表者名
  牧野貴樹, 澁谷長史, 白川真一
- 雑誌名
  
  計測と制御
  
  巻: 52 ページ: 1136-1143
- 関連する報告書
  2013 実績報告書
[学会発表] 部分観測環境のパラメトリック記述に基づく高速モデルパラメータ逆強化学習プログラム2014
- 著者名/発表者名
  牧野貴樹, 城真範, 合原一幸
- 学会等名
  人工知能学会全国大会
- 発表場所
  ひめぎんホール
- 関連する報告書
  2013 実績報告書
[学会発表] Estimation of POMDP Parameters by Apprenticeship Learning2014
- 著者名/発表者名
  Takaki Makino
- 学会等名
  Workshop on MDP/POMDP Applications to Medical Data
- 発表場所
  東京大学大学院情報理工学研究科 I-REF棟
- 関連する報告書
  2013 実績報告書
- 招待講演
[学会発表] 強化学習をベイズで理解する2014
- 著者名/発表者名
  牧野　貴樹
- 学会等名
  神経科学と統計科学の対話４
- 発表場所
  統計数理研究所(立川市)
- 関連する報告書
  2013 実績報告書
- 招待講演
[学会発表] 機械学習の数学的側面2014
- 著者名/発表者名
  牧野貴樹
- 学会等名
  ミニワークショップ「機械学習×力学系」
- 発表場所
  東京大学生産技術研究所
- 関連する報告書
  2013 実績報告書
- 招待講演
[備考] LUKE (Learning Underlying Knowledge of Experts)
- URL
  http://www.snowelm.com/~t/research/software/luke.ja.html
- 関連する報告書
  2013 実績報告書

環境モデル徒弟学習の抜本的高速化技術の開発と実用的対話システムのプロトタイプ構築

研究代表者

牧野 貴樹 東京大学, 生産技術研究所, 特任准教授 (20418651)

4,160千円 (直接経費: 3,200千円、間接経費: 960千円)

報告書

研究成果

[雑誌論文] 実用化する強化学習技術2014

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] 自然言語処理における逆強化学習・模倣学習の適用2013

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] パネルティスカッション: 強化学習 @ 2025 A.D. - 10年後の強化学習が目指すもの2013

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 部分観測環境のパラメトリック記述に基づく高速モデルパラメータ逆強化学習プログラム2014

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] Estimation of POMDP Parameters by Apprenticeship Learning2014

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] 強化学習をベイズで理解する2014

著者名/発表者名

学会等名

発表場所

関連する報告書

[学会発表] 機械学習の数学的側面2014

著者名/発表者名

学会等名

発表場所

関連する報告書

[備考] LUKE (Learning Underlying Knowledge of Experts)

URL

関連する報告書

牧野貴樹東京大学, 生産技術研究所, 特任准教授 (20418651)