2000 Fiscal Year Annual Research Report
実環境ロボット学習における背景知識供与戦略および学習環境の制御戦略に関する研究
Project/Area Number |
12750204
|
Research Institution | The University of Tokyo |
Principal Investigator |
矢入 健久 東京大学, 先端科学技術研究センター, 助手 (90313189)
|
Keywords | 知能ロボット / 機械学習 / 情報理論 / 概念学習 / 状態抽象化 / 強化学習 / 行動獲得 |
Research Abstract |
本研究全体の目的は,自律ロボットが実環境において効率的かつ柔軟な行動学習を実現できるようになるための,「背景知識の供与戦略」および「学習環境のコントロール戦略」に関する一般的方法論を明らかにすることであり,初年度の主な目標は以下の2つであった. ・ロボット学習実験システムの構築 ・異種の学習手法を統合するための背景知識の供与戦略に関する理論の構築 まず,前者については,当研究費補助金によって購入したロボット台車をベースとした自律移動ロボットを作成した.これは,カラーカメラによる画像処理能力,高速CPUによる高度な情報処理能力,無線LANによる外部システムとの通信機能などを持ち,次年度に予定されている様々な実験を遂行するための環境がほぼ整った. 次に,後者については,従来個々に研究・提案されてきた自律ロボットのための学習手法を効果的に統合する一つのアプローチとして、「帰納的概念学習に基づく自律的状態空間構成」と,「強化学習に基づく行動ルール獲得」との一般的な統合法を、情報理論的観点から提案した。この提案手法は既に、シミュレーションベースで検証を行っており、前述の実ロボットへの適用を待つ段階となっている。 また、これまでの研究成果の発表についても後記の通り積極的に行っている.
|
-
[Publications] 矢入健久,堀浩一,中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 130-140 (2001)
-
[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Dynamic Reconstruction of State Space for Behavior Acquisition or Reactive Agent"The 6th International Conference on Intelligent Autonomous Systems. 549-554 (2000)
-
[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Unified Criterion of State Generalization for Reactive Autonomous Agents"The Sixth Pacific Rim International Conference on Artificial Intelligence. 340-350 (2000)
-
[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Autonomous Reconstruction of State Space for Learning of Robot Behavior"IEEE/RSJ International Conference on Intelligent Robots and Systems. 891-896 (2000)