計画研究
今年度も,特徴選択・抽出に関する研究と強化学習に関する研究に取り組んだ.特徴選択に関しては,条件付き確率密度推定における高精度な特徴選択アルゴリズムを開発した.これは,スパース正則化技術を用いたアルゴリズムであり,計算効率が良い.また,データ空間の幾何構造を活かした教師なし次元削減手法を開発した.これは,データがリーマン構造を持った空間に属する場合に有効なアルゴリズムである.更に,確率密度微分の直接推定に基づく教師付き次元削減手法を開発した.これは,従来のように部分空間を繰り返しアルゴリズムによって探索をする必要がなく,解析的に解が計算できるという特徴を持つ手法である.また,スパース正則化技術を用いたテンソルデータの回帰・分類アルゴリズムも開発した.これは,データがベクトルでなくテンソル構造を保つ場合に,その構造を保ったまま回帰・分類を行うというアルゴリズムである.そして,これらのアルゴリズムの有効性を,計算機実験により実証した.強化学習に関しては,正則化による政策勾配法の安定化に取り組んだ.これは,推定した政策勾配の分散を明示的に正則加工に取り込むアプローチであり,アルゴリズムの安定化に大きく貢献することを数値実験により確認した.また,オンライン政策勾配アルゴリズムの開発を行ない,リグレットとよばれる誤差指標が最適な速さで減少していくことを理論的に明らかにした.更に,次元削減付きモデルベース強化学習アルゴリズムを開発し,その有効性を計算機実験により示した.これらのアルゴリズム開発研究に加え,昨年度までに開発した強化学習手法を,コンピュータアートおよびヒューマノイドロボット制御に応用した.特にロボット制御に関しては,一般に困難とされる実空間における少ない試行回数でのロボットの制御システムが獲得可能であることを実験的に示した.また,強化学習に関する英語書籍を出版した.
27年度が最終年度であるため、記入しない。
すべて 2016 2015 その他
すべて 雑誌論文 (6件) (うち国際共著 1件、 査読あり 6件、 謝辞記載あり 6件) 学会発表 (7件) (うち国際学会 7件) 図書 (2件) 備考 (2件)
Neural Computation
巻: 28 ページ: 563-593
巻: 28 ページ: 686-715
IEEE Robotics & Automation Magazine
巻: 23 ページ: 96-105
Robotics and Autonomous Systems
巻: 75 ページ: 340-351
Machine Learning
巻: 100 ページ: 161-182
Biological Cybernetics
巻: 109 ページ: 597-610
http://www.ms.k.u-tokyo.ac.jp/sugi/
http://www.cns.atr.jp/~xmorimo/