研究課題/領域番号 |
09878079
|
研究種目 |
萌芽的研究
|
配分区分 | 補助金 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 九州工業大学 |
研究代表者 |
江島 俊朗 九州工業大学, 情報工学部, 教授 (00124553)
|
研究分担者 |
大橋 健 九州工業大学, 情報工学部, 助手 (00233239)
吉田 隆一 九州工業大学, 情報工学部, 助教授 (70200996)
|
研究期間 (年度) |
1997
|
研究課題ステータス |
完了 (1997年度)
|
配分額 *注記 |
1,800千円 (直接経費: 1,800千円)
1997年度: 1,800千円 (直接経費: 1,800千円)
|
キーワード | 強化学習 / 自律型ロボット / デットロック / 協調行動 / 行動獲得 / マルチエージェント |
研究概要 |
本研究では、「八方塞がり状態では、思いもかけない行動が行き詰まりを打破するのに役立つ」とういう人間社会では一般的に信じられているものを、ロボットの行動選択にとりいれた方式について検討した。我々はこれまで、環境からの情報を視覚により収集する複数の自律的ロボットが、共通の目的を達成しようと動き回わる状況を想定し、環境状態に応じて適切な行動を学習を用いて獲得する方法を検討してきた。単独ロボットの場合と異り、ロボットが複数になることにより、ロボット同士の衝突回避行動、デットロック回避行動、複数のロボット間の利害が対立した場合の競合解消行動、が必要となる。これらの行動をすべて考慮にいれて人間がロボットの行動計画を立てようとすると、行動決定のアルゴリズムが大変複雑になり、実行も効率的ではない。環境からの情報により、これらの行動をロボットが学習を用いて自動的に獲得できれば、人間がプログラムを書く手間が省けて大変有意義である。しかしながら、学習により行動獲得を行う方式では、複数ロボットが獲得する協調行動の効率性とデツトロックの発生率は正の相関関係にあり、大きな問題となっている。その問題の解決をために、行動決定に揺らぎの導入を考えた。すなわち、行動選択の確率分布を「飢蛾」状態の強弱に応じて変化させ、飢餓状態にないときは一意に行動が決定され、飢餓状態になればなるほと行動選択がランダムに近ずく機構を導入した。 シミュレーション実験の結果、ロボットの(飢餓)状態の程度に依存して揺らぎの大きさを適切に定める方法の有効性を確認し、普遍的な手法として展開できる見通しを得た。
|