揺らぎの作用を利用した複数ロボットの協調作業のための行動計画

研究課題

研究課題/領域番号	09878079
研究種目	萌芽的研究
配分区分	補助金
研究分野	情報システム学(含情報図書館学)
研究機関	九州工業大学
研究代表者	江島俊朗九州工業大学, 情報工学部, 教授 (00124553)
研究分担者	大橋健九州工業大学, 情報工学部, 助手 (00233239) 吉田隆一九州工業大学, 情報工学部, 助教授 (70200996)
研究期間 (年度)	1997
研究課題ステータス	完了 (1997年度)
配分額 *注記	1,800千円 (直接経費: 1,800千円) 1997年度: 1,800千円 (直接経費: 1,800千円)
キーワード	強化学習 / 自律型ロボット / デットロック / 協調行動 / 行動獲得 / マルチエージェント
研究概要	本研究では、「八方塞がり状態では、思いもかけない行動が行き詰まりを打破するのに役立つ」とういう人間社会では一般的に信じられているものを、ロボットの行動選択にとりいれた方式について検討した。我々はこれまで、環境からの情報を視覚により収集する複数の自律的ロボットが、共通の目的を達成しようと動き回わる状況を想定し、環境状態に応じて適切な行動を学習を用いて獲得する方法を検討してきた。単独ロボットの場合と異り、ロボットが複数になることにより、ロボット同士の衝突回避行動、デットロック回避行動、複数のロボット間の利害が対立した場合の競合解消行動、が必要となる。これらの行動をすべて考慮にいれて人間がロボットの行動計画を立てようとすると、行動決定のアルゴリズムが大変複雑になり、実行も効率的ではない。環境からの情報により、これらの行動をロボットが学習を用いて自動的に獲得できれば、人間がプログラムを書く手間が省けて大変有意義である。しかしながら、学習により行動獲得を行う方式では、複数ロボットが獲得する協調行動の効率性とデツトロックの発生率は正の相関関係にあり、大きな問題となっている。その問題の解決をために、行動決定に揺らぎの導入を考えた。すなわち、行動選択の確率分布を「飢蛾」状態の強弱に応じて変化させ、飢餓状態にないときは一意に行動が決定され、飢餓状態になればなるほと行動選択がランダムに近ずく機構を導入した。シミュレーション実験の結果、ロボットの(飢餓)状態の程度に依存して揺らぎの大きさを適切に定める方法の有効性を確認し、普遍的な手法として展開できる見通しを得た。

報告書

(1件)

1997 実績報告書

研究成果
(2件)

すべてその他

すべて文献書誌 (2件)

[文献書誌] 榎田修一,大橋健,吉田隆一,江島俊朗: "複数ロボット環境における自律的状態空間の統合" 電気関係学会九州支部連合大学講演論文集. 577 (1997)
- 関連する報告書
  1997 実績報告書
[文献書誌] 山田総司,大橋健,吉田隆一,江島俊朗: "マルチエージェント環境における自律型ロボットのための強化学習に関する研究" 第12回情報処理学会九州支部研究会資料. 177-186 (1998)
- 関連する報告書
  1997 実績報告書