2012 Fiscal Year Annual Research Report
大規模データに適用可能なマルコフ確率場の学習アルゴリズムに関する研究
Project/Area Number |
22700232
|
Research Institution | Kyoto University |
Principal Investigator |
前田 新一 京都大学, 情報学研究科, 助教 (20379530)
|
Project Period (FY) |
2010-04-01 – 2013-03-31
|
Keywords | マルコフ確率場 / 詳細釣り合い / 変分ベイズ推定 / 因子化仮定 / セミパラメトリック推定 / block-coordinate descent |
Research Abstract |
本研究では、高次元のマルコフ確率場の学習・推論アルゴリズムの改良を目的としている。 ベイズ推定の推論アルゴリズムに関しては、計算量削減の観点から事後分布を独立な分布として近似する方法(因子化仮定)が広く用いられているが、変数間の相関を表現できないといった表現能力の制約があった。そこで階層ベイズ推定の枠組みの中で、変数の階層間に相関を入れつつその最適化に変分法を用いることでその表現能力の向上を図った。 ただし最適化する分布を複雑化すると最適化が難しくなるため、ここでは主に画像を対象として空間的、あるいは時間的なマルコフ性、すなわち変数間の相関が少数の隣接変数にしか存在しないことを利用してGroup-coordinate descentによる最適化を行った。これによって良好な近似推論が可能となることを顕微鏡画像の深さ推定の問題や、X線CTの問題で実証した。 このようなマルコフ性の活用による探索が強化学習にも応用できることに着目し、強化学習の新しい推論アルゴリズムと理論解析の研究を行った。強化学習においては状態空間が大きい場合、状態空間上の関数である価値関数や方策の学習が困難になる。そこで状態遷移のマルコフ性を利用した、隣接時刻の状態間で成り立つベルマン方程式が成り立つような学習がなされるが、これをセミパラメトリック統計学の観点から一般化したアルゴリズムを提案し、その漸近的な挙動を明らかにした。 また、方策自体を状態空間上の関数として表さずに、初期状態を固定して時刻上の関数として表現することで大幅に関数の複雑さを減らし、大規模な状態空間をもつ問題に適用可能なアルゴリズムを提案した。
|
Current Status of Research Progress |
Reason
24年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
24年度が最終年度であるため、記入しない。
|