行動確率場モデルによる複数ロボットの協調作業のための行動選択方式

研究課題

研究課題/領域番号	10680408
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	情報システム学(含情報図書館学)
研究機関	九州工業大学
研究代表者	江島俊朗九州工業大学, 情報工学部, 教授 (00124553)
研究分担者	大橋健九州工業大学, 情報工学部, 助手 (00233239) 吉田隆一九州工業大学, 情報工学部, 助教授 (70200996)
研究期間 (年度)	1998 – 2000
研究課題ステータス	完了 (1999年度)
配分額 *注記	3,300千円 (直接経費: 3,300千円) 1999年度: 700千円 (直接経費: 700千円) 1998年度: 2,600千円 (直接経費: 2,600千円)
キーワード	強化学習 / 自律移動型ロボット / 関数近似 / 行動獲得 / 自律統合 / ロボカップ / Q-学習 / 自律型ロボット / 自己組織化
研究概要	自律型ロボットの学習による行動獲得は,先見的な知識だけでは補いきれない行動決定の問題に対して有効な手法である.従来,センサ空間を離散化し,有限個の状態上での行動決定問題として定式化され,Q-学習など興味深い学習法が提案されてきた.しかし,離散化に伴う誤差が無視できない状況も多く,そのため誤差の影響を少なくする高精度の方法が研究対象になってきた. 本研究では,Q-学習を拡張した拡張Q-学習を提案する.拡張Q-学習とは,行動確率場モデルに基づき,センサ空間から行動空間への写像を導くものである.本モデルでは写像を表す行動選択確率を規定する行動価値関数は,有限個の基底関数の重み付き和ととして表される.学習は重みを調整する作業に対し,また,精度を保持しつつより簡素なモデルで関数近似を行うために基底関数の自律統合を学習アルゴリズムに追加した. 提案した拡張Q-学習を自律移動型ロボットの行動獲得に応用した。具体的には、サッカーの競技を自律移動型ロボットに行わせようとするロボカップの競技に出場するロボットに焦点を当てた。その中で、ゴールキーパーの行動獲得を拡張Q-学習を活用して行なった。その結果、拡張Q-学習の特徴である自律統合のメカニズムがうまく機能して、獲得した行動を簡潔な形で表現することが可能になった。併せて、学習に費される学習時間も大幅に削減できた。更に、環境の動的な変化、例えば、ロボットの脚回りの動特性が変わった、カメラレンズにヒビが入ったなどの変化、に対しても、柔軟に且つ弾力的に対応できる可能性を示すことができた。提案手法は、1999年のストックホルムで開催されたRobCup'99にKireというチーム名で参戦したキーパーの行動獲得のところに実践応用された。

報告書

(3件)

1999 実績報告書研究成果報告書概要
1998 実績報告書

研究成果
(8件)

すべてその他

すべて文献書誌 (8件)

[文献書誌] 榎田修一他: "行動確率場モデルに基づく強化学習"情報処理学会論文誌(数理モデル化と問題解析). 40SIG9. 72-80 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Enokida etc.: "Stochastic field model for autonomous robot learning"Proc. of IEEE Int. Conf. on SMC. II. 752-757 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Enokida etc.: "Reinforcement Learning Based on Stochastic Field Models"Journal of IPSJ. No. SIG9 40. 72-80 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] Enokida etc.: "Stochastic Field Model for autonomous robot learning"Proc.of IEEE Int. Conf. on SMC. II. 752-757 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1999 研究成果報告書概要
[文献書誌] 榎田修一他: "行動確率場モデルに基づく強化学習"情報処理学会論文誌. 40.SIG9. 72-80 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] Enokida etc.: "Stochastic Field Model for Auta***** robot learning"Proc.of IEEE Int.Conf.on SMC. II. 752-757 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] 榎田修一,大橋,吉田,江島: "行動確率場モデルによる行動獲得手法の高性能化" 第16回日本ロボット学会学術講演会予稿集. Vol.1. 405-406 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 福田,大橋,吉田,江島: "自律型ロボットの強化学習によるショート行動の獲得" 第51回電気関連九州支部連合大会講演会予稿集. 92 (1998)
- 関連する報告書
  1998 実績報告書

行動確率場モデルによる複数ロボットの協調作業のための行動選択方式

研究代表者

江島 俊朗 九州工業大学, 情報工学部, 教授 (00124553)

3,300千円 (直接経費: 3,300千円)

報告書

研究成果

[文献書誌] 榎田修一 他: "行動確率場モデルに基づく強化学習"情報処理学会論文誌(数理モデル化と問題解析). 40SIG9. 72-80 (1999)

説明

関連する報告書

[文献書誌] Enokida etc.: "Stochastic field model for autonomous robot learning"Proc. of IEEE Int. Conf. on SMC. II. 752-757 (1999)

説明

関連する報告書

[文献書誌] Enokida etc.: "Reinforcement Learning Based on Stochastic Field Models"Journal of IPSJ. No. SIG9 40. 72-80 (1999)

説明

関連する報告書

[文献書誌] Enokida etc.: "Stochastic Field Model for autonomous robot learning"Proc.of IEEE Int. Conf. on SMC. II. 752-757 (1999)

説明

関連する報告書

[文献書誌] 榎田修一 他: "行動確率場モデルに基づく強化学習"情報処理学会論文誌. 40.SIG9. 72-80 (1999)

関連する報告書

[文献書誌] Enokida etc.: "Stochastic Field Model for Auta***** robot learning"Proc.of IEEE Int.Conf.on SMC. II. 752-757 (1999)

関連する報告書

[文献書誌] 榎田修一,大橋,吉田,江島: "行動確率場モデルによる行動獲得手法の高性能化" 第16回日本ロボット学会学術講演会予稿集. Vol.1. 405-406 (1998)

関連する報告書

[文献書誌] 福田,大橋,吉田,江島: "自律型ロボットの強化学習によるショート行動の獲得" 第51回電気関連九州支部連合大会講演会予稿集. 92 (1998)

関連する報告書

江島俊朗九州工業大学, 情報工学部, 教授 (00124553)

[文献書誌] 榎田修一他: "行動確率場モデルに基づく強化学習"情報処理学会論文誌(数理モデル化と問題解析). 40SIG9. 72-80 (1999)

[文献書誌] 榎田修一他: "行動確率場モデルに基づく強化学習"情報処理学会論文誌. 40.SIG9. 72-80 (1999)