研究課題
本研究では、高次元のマルコフ確率場の学習・推論アルゴリズムの改良を目的としている。ベイズ推定の推論アルゴリズムに関しては、計算量削減の観点から事後分布を独立な分布として近似する方法(因子化仮定)が広く用いられているが、変数間の相関を表現できないといった表現能力の制約があった。そこで階層ベイズ推定の枠組みの中で、変数の階層間に相関を入れつつその最適化に変分法を用いることでその表現能力の向上を図った。ただし最適化する分布を複雑化すると最適化が難しくなるため、ここでは主に画像を対象として空間的、あるいは時間的なマルコフ性、すなわち変数間の相関が少数の隣接変数にしか存在しないことを利用してGroup-coordinate descentによる最適化を行った。これによって良好な近似推論が可能となることを顕微鏡画像の深さ推定の問題や、X線CTの問題で実証した。このようなマルコフ性の活用による探索が強化学習にも応用できることに着目し、強化学習の新しい推論アルゴリズムと理論解析の研究を行った。強化学習においては状態空間が大きい場合、状態空間上の関数である価値関数や方策の学習が困難になる。そこで状態遷移のマルコフ性を利用した、隣接時刻の状態間で成り立つベルマン方程式が成り立つような学習がなされるが、これをセミパラメトリック統計学の観点から一般化したアルゴリズムを提案し、その漸近的な挙動を明らかにした。 また、方策自体を状態空間上の関数として表さずに、初期状態を固定して時刻上の関数として表現することで大幅に関数の複雑さを減らし、大規模な状態空間をもつ問題に適用可能なアルゴリズムを提案した。
24年度が最終年度であるため、記入しない。
すべて 2013 2012
すべて 雑誌論文 (3件) (うち査読あり 2件) 学会発表 (9件) (うち招待講演 1件)
計測と制御
巻: 52(3) ページ: 277-283
SICE Jounal of Control,Measument, and System Integration
巻: 5(4) ページ: 249-258
Neural Networks
巻: 31 ページ: 88-92
10.1016/j.neunet.2012.03.004