2008 Fiscal Year Annual Research Report
ベイジアンネット混合モデルを用いた環境適応型オンライン学習システム
Project/Area Number |
19700138
|
Research Institution | Tokyo National College of Technology |
Principal Investigator |
北越 大輔 Tokyo National College of Technology, 情報工学科, 講師 (50378238)
|
Keywords | ベイジアンネット / 混合モデル / 強化学習 / 利益共有法 / 環境適応型学習システム / Khepera II ロボット |
Research Abstract |
本研究では, 機械学習の一つである強化学習と, 確率モデルとして知られるベイジアンネット(BN)の混合モデルを用いた環境適応型オンライン学習システムを提案し, これを実装した行為者(移動エージェント・ロボット)の複雑・動的な環境での適応性能評価, および, システムの環境表現能力と個々のBNとの関連性について考察することを目的とした. 当該年度に実施した実験の結果より, 提案手法はノイズを含む環境や, 環境の様々な変化に対して柔軟に適応可能であることを確認した. 加えて, 指数型混合モデルに固有の特徴として, 広範な環境情報を小数のBNによって表現可能であることも実験的に示した. BN混合モデルの形式を利用した提案学習システムは, ノイズへの頑健性, 環境変化への追従性を有する上, 他の問題領域へも容易に適用可能であるため, 従来の適応学習システムでは適用が困難な, ノイズや不確実性を含む広く一般的な環境においても, 良質な振舞を学習可能となることが期待される. 加えて, 混合モデルの強力な情報表現能力, およびBNの結合構造を利用した多様な確率推論手法を活用することで, このモデル単体のみを用いた, 様々な予測問題への効果的な適用も可能であると考えられる. 現在, これまで得られた研究成果をもとに, 複数の行為者が存在する環境における実験を実施し, 個々の行為者が他の行為者の振舞の変化や環境変化に適応することを確認している. 実験結果を論文としてまとめ次第, 学会での発表等を通して成果を公表する予定である.
|