2007 Fiscal Year Annual Research Report
ベイジアンネット混合モデルを用いた環境適応型オンライン学習システム
Project/Area Number |
19700138
|
Research Institution | Nagoya Institute of Technology |
Principal Investigator |
北越 大輔 Nagoya Institute of Technology, 大学院・工学研究科, 助教 (50378238)
|
Keywords | ベイジアンネット / 強化学習 / 適応システム / Profit Sharing / 確率推論 |
Research Abstract |
本研究では,機械学習の一つである強化学習と,確率モデルとして知られるベイジアンネット(BN)の混合モデルを用いた環境適応型オンライン学習システムを提案し,これを実装した行為者(移動エージェント・ロボット)の複雑・動的な環境での適応性能評価と,システムの環境表現能力と個々のBNとの関連性評価を目的としている.平成19年度は当初の研究計画に従い,以下の通り研究を遂行した. 1.計算機実験の実施 2.実験結果をもとにシステムを修正・拡張 3.実環境における移動ロボットを用いた実験の実施 4.実環境におけるシステム性能評価,環境情報表現に関する考察 計算機実験の結果,BNで表現される各環境に対する知識の「質」は,ネットワーク構造決定に用いるデータ収集時の設定に依存することが確認され,良質の知識を獲得するための指針を得た.また,実環境下でも同様の指針を用いて効果的に機能するBNを獲得可能であることを確認した. 研究計画遂行と来年度へ向けた準備のため,高性能計算機,ロボット本体および周辺機器を購入したが,機器の選定,ロボットの納品等に時間を要したため計画遂行に遅延が生じ,現時点において研究成果は未公表である(現在,海外学術雑誌へ投稿中). 今年度の研究成果から,提案システムを実装した行為者は比較的少量の計算資源で,ノイズを含む環境や動的に変化する環境へ適応可能であることがわかった.実世界で機能するシステムにとって,ノイズや環境変化への対応は不可避である.ノイズの影響を軽減し,変化へ柔軟に適応可能な提案システムは,将来的に様々な適応的学習システムへ適用できる可能性を有している. 現在,研究成果は行為者が一体の場合のみで確認されている.平成20年度は行為者の増加に伴う計算量に関する考察や,より複雑な状況下での性能評価を行い,実用的な問題に対する適用可能性について評価予定である.
|
Research Products
(1 results)