今年度は、ノンパラメトリックベイズモデルを利用した強化学習研究のための拡張のステップとして2つの研究を行った。ひとつは、隠れマルコフモデル(HMM)における状態を階層的にクラスタリングする手法である。研究においては自然言語を対象にしてモデルの正当性を示したが、同様のモデルは、強化学習で扱うような複雑な環境をより効果的に学習するために有効な方法のひとつであると考えられる。もうひとつはHMMのノンパラメトリックベイズモデルのような、階層化された中華料理店過程からの複数の抽出の同時分布を適切に扱うためのサンプリング法の開発である。この方法により、より複雑なモデルを構築した場合でも適切なモデル推定が可能になることから、今後、ノンパラメトリックベイズ手法による強化学習を実現する際に有効であると考えられる。
|