揺らぎの作用を利用した複数ロボットの協調作業のための行動計画

Research Project

Project/Area Number	09878079
Research Category	Grant-in-Aid for Exploratory Research
Allocation Type	Single-year Grants
Research Field	情報システム学(含情報図書館学)
Research Institution	Kyushu Institute of Technology
Principal Investigator	江島俊朗九州工業大学, 情報工学部, 教授 (00124553)
Co-Investigator(Kenkyū-buntansha)	大橋健九州工業大学, 情報工学部, 助手 (00233239) 吉田隆一九州工業大学, 情報工学部, 助教授 (70200996)
Project Period (FY)	1997
Project Status	Completed (Fiscal Year 1997)
Budget Amount *help	¥1,800,000 (Direct Cost: ¥1,800,000) Fiscal Year 1997: ¥1,800,000 (Direct Cost: ¥1,800,000)
Keywords	強化学習 / 自律型ロボット / デットロック / 協調行動 / 行動獲得 / マルチエージェント
Research Abstract	本研究では、「八方塞がり状態では、思いもかけない行動が行き詰まりを打破するのに役立つ」とういう人間社会では一般的に信じられているものを、ロボットの行動選択にとりいれた方式について検討した。我々はこれまで、環境からの情報を視覚により収集する複数の自律的ロボットが、共通の目的を達成しようと動き回わる状況を想定し、環境状態に応じて適切な行動を学習を用いて獲得する方法を検討してきた。単独ロボットの場合と異り、ロボットが複数になることにより、ロボット同士の衝突回避行動、デットロック回避行動、複数のロボット間の利害が対立した場合の競合解消行動、が必要となる。これらの行動をすべて考慮にいれて人間がロボットの行動計画を立てようとすると、行動決定のアルゴリズムが大変複雑になり、実行も効率的ではない。環境からの情報により、これらの行動をロボットが学習を用いて自動的に獲得できれば、人間がプログラムを書く手間が省けて大変有意義である。しかしながら、学習により行動獲得を行う方式では、複数ロボットが獲得する協調行動の効率性とデツトロックの発生率は正の相関関係にあり、大きな問題となっている。その問題の解決をために、行動決定に揺らぎの導入を考えた。すなわち、行動選択の確率分布を「飢蛾」状態の強弱に応じて変化させ、飢餓状態にないときは一意に行動が決定され、飢餓状態になればなるほと行動選択がランダムに近ずく機構を導入した。シミュレーション実験の結果、ロボットの(飢餓)状態の程度に依存して揺らぎの大きさを適切に定める方法の有効性を確認し、普遍的な手法として展開できる見通しを得た。

Report

(1 results)

1997 Annual Research Report

Research Products
(2 results)

All Publications (2 results)

[Publications] 榎田修一,大橋健,吉田隆一,江島俊朗: "複数ロボット環境における自律的状態空間の統合" 電気関係学会九州支部連合大学講演論文集. 577 (1997)
- Related Report
  1997 Annual Research Report
[Publications] 山田総司,大橋健,吉田隆一,江島俊朗: "マルチエージェント環境における自律型ロボットのための強化学習に関する研究" 第12回情報処理学会九州支部研究会資料. 177-186 (1998)
- Related Report
  1997 Annual Research Report