実環境ロボット学習における背景知識供与戦略および学習環境の制御戦略に関する研究

Research Project

Project/Area Number	12750204
Research Category	Grant-in-Aid for Encouragement of Young Scientists (A)
Allocation Type	Single-year Grants
Research Field	Intelligent mechanics/Mechanical systems
Research Institution	The University of Tokyo
Principal Investigator	矢入健久東京大学, 先端科学技術研究センター, 助手 (90313189)
Project Period (FY)	2000 – 2001
Project Status	Completed (Fiscal Year 2001)
Budget Amount *help	¥2,200,000 (Direct Cost: ¥2,200,000) Fiscal Year 2001: ¥400,000 (Direct Cost: ¥400,000) Fiscal Year 2000: ¥1,800,000 (Direct Cost: ¥1,800,000)
Keywords	知能ロボット / 機械学習 / 情報理論 / 概念学習 / 強化学習 / 環境地図獲得 / 状態抽象化 / 行動獲得
Research Abstract	本研究の最終年度である本年度は、主に2つの具体的なタスクを対象として取り上げ、ロボットの学習戦略に関する本研究の提案手法を適用した。その2つのタスクとは、・環境報酬に基づく反射的ルール獲得・定性的な観測情報に基づく環境地図の学習である。まず、前者については、従来ロボット学習の分野では別個に扱われてきた帰納的概念学習法と強化学習法とを統合する方法を情報理論的な立場から提案した。この成果は別掲のように雑誌論文で発表済みである。また、後者については、従来ロボット設計者が暗黙のうちにプログラムに埋め込んでいた環境に関する定性的知識をロボット自身が処理し、環境地図を学習する新しい手法を提案した。この成果も国際学会等で発表され、また雑誌論文に投稿中である。以上のように、本研究で得られた成果はロボット学習分野において非常に新規性・意義に富んだものであり、本課題が終了した後もさらに発展的なテーマに取り組んで行く予定である。

Report

(2 results)

2001 Annual Research Report
2000 Annual Research Report

Research Products
(7 results)

All Other

All Publications (7 results)

[Publications] 矢入健久, 堀浩一, 中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 128-138 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 矢入健久, 堀浩一: "強化学習エージェントの状態空間構成問題への情報理論的アプローチ"第4回情報論的学習理論ワークショップ. 315-320 (2001)
- Related Report
  2001 Annual Research Report
[Publications] Takehisa Yairi, Kosuke Hirama, Koichi Hori: "Fast and Simple Topological Map Construction Based on Cooccurrence Frequency of Landmark Observation"IEEE/RSJ International Conference on Intelligent Robots and Systems. 1263-1268 (2001)
- Related Report
  2001 Annual Research Report
[Publications] 矢入健久,堀浩一,中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 130-140 (2001)
- Related Report
  2000 Annual Research Report
[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Dynamic Reconstruction of State Space for Behavior Acquisition or Reactive Agent"The 6th International Conference on Intelligent Autonomous Systems. 549-554 (2000)
- Related Report
  2000 Annual Research Report
[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Unified Criterion of State Generalization for Reactive Autonomous Agents"The Sixth Pacific Rim International Conference on Artificial Intelligence. 340-350 (2000)
- Related Report
  2000 Annual Research Report
[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Autonomous Reconstruction of State Space for Learning of Robot Behavior"IEEE/RSJ International Conference on Intelligent Robots and Systems. 891-896 (2000)
- Related Report
  2000 Annual Research Report

実環境ロボット学習における背景知識供与戦略および学習環境の制御戦略に関する研究

Principal Investigator

矢入 健久 東京大学, 先端科学技術研究センター, 助手 (90313189)

¥2,200,000 (Direct Cost: ¥2,200,000)

Report

Research Products

[Publications] 矢入健久, 堀浩一, 中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 128-138 (2001)

Related Report

[Publications] 矢入健久, 堀浩一: "強化学習エージェントの状態空間構成問題への情報理論的アプローチ"第4回情報論的学習理論ワークショップ. 315-320 (2001)

Related Report

[Publications] Takehisa Yairi, Kosuke Hirama, Koichi Hori: "Fast and Simple Topological Map Construction Based on Cooccurrence Frequency of Landmark Observation"IEEE/RSJ International Conference on Intelligent Robots and Systems. 1263-1268 (2001)

Related Report

[Publications] 矢入健久,堀浩一,中須賀真一: "複数行動結果を考慮した最尤推定に基づく状態一般化法"人工知能学会誌. 16・1. 130-140 (2001)

Related Report

[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Dynamic Reconstruction of State Space for Behavior Acquisition or Reactive Agent"The 6th International Conference on Intelligent Autonomous Systems. 549-554 (2000)

Related Report

[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Unified Criterion of State Generalization for Reactive Autonomous Agents"The Sixth Pacific Rim International Conference on Artificial Intelligence. 340-350 (2000)

Related Report

[Publications] Takehisa Yairi,Koichi Hori and Shinichi Nakasuka: "Autonomous Reconstruction of State Space for Learning of Robot Behavior"IEEE/RSJ International Conference on Intelligent Robots and Systems. 891-896 (2000)

Related Report

矢入健久東京大学, 先端科学技術研究センター, 助手 (90313189)