2014 Fiscal Year Annual Research Report
対戦相手の行動予測に基づくゲームロボットの意思決定アルゴリズムの研究
Publicly Offered Research
Project Area | Elucidation of neural computation for prediction and decision making: toward better human understanding and applications |
Project/Area Number |
26120708
|
Research Institution | Chiba University |
Principal Investigator |
並木 明夫 千葉大学, 工学(系)研究科(研究院), 准教授 (40376611)
|
Project Period (FY) |
2014-04-01 – 2016-03-31
|
Keywords | 知能ロボティクス / スマートセンサ情報システム / 超高速情報処理 / 制御工学 / ヒューマン・ロボット・インタラクション |
Outline of Annual Research Achievements |
本研究課題では対人型物理的インタラクションゲームの一例として,エアホッケーゲームロボットなどの対戦型ゲームを対象として予測と意志決定アルゴリズムの研究を行った.エアホッケーゲームは単純な打ち合いだけでなく,対戦相手の状態に合わせて弱点をつく,フェイントをかけるなどの物理的かつ心理的な要素を含む高度なゲームであり,リアルタイムでの予測と意志決定の問題解決が性能向上のカギとなる.本研究ではこれまでに開発してきたエアホッケーロボットをベースとして,予測と意志決定の問題を実験的にアプローチすることを目的とする.本年度の研究概要は次の通りである.1. チェスや将棋のように対戦相手の行動を先読みして自分の手が決定するための動作決定理論をエアホッケーゲームに適用し,最適動作戦略アルゴリズムを開発した.2. 打撃時の挙動について運動量保存則に基づいてモデル化を行い非線形補正項を加えることで精度向上を実現した.3. Matlabと物理モデルを用いて実機システムとほぼ同等の性能を反映した物理シミュレータを開発した.4. 変化点検出アルゴリズムChange Finder を適用することでフェイントに惑わされづらいロバスト性の高いチャンバラロボットを開発した.5. ロボットの動作の高速化のための制御アルゴリズムにより高速な剣玉タスクを実現した.6. 人間の意図推定アルゴリズムを遠隔操作ロボットのマスタ操作システムに応用し,リーチング動作と把持動作の自動補正アルゴリズムについて提案した.7. 高速3次元認識のために符号化パターン投影型高速ビジョンの開発を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度の目標である対戦相手の行動計測と予測・意志決定のモデル化については,エアホッケーゲームにおいて,腕の到達時間と到達可能性について複数の動作戦略に対して状態価値をモデル化することができており予定通り進捗している.また,ロボットのための予測と意志決定アルゴリズムについては,上記モデルについて動的計画法に基づき最適解を計算する手法について開発し,シミュレーションによってその有効性を示している.また,計画書では次年度の予定であったエアホッケーロボットの物理シミュレータの開発についても本年度中に進められ,基本的な部分は完成している. 本年度は研究成果がそれ以外のロボットにも適用され成果が得られている.まず,チャンバラロボットの対戦アルゴリズムについて研究がすすめられ,高い応答性能を持つシステムが構築できた.また,高速ロボット制御については,剣玉ロボットなどのダイナミックマニピュレーションに応用され,人間の意思決定の推定については,遠隔操作ロボットの操縦補助に応用することができた.
|
Strategy for Future Research Activity |
今後は次の研究課題について研究を進める. 1. 対戦相手の行動計測と予測・意志決定のモデル化:開発した高速3次元センサを用いて対戦相手の身体形状を計測する手法を開発する。また,開発した動作の状態価値評価モデルに対して,対戦相手の動的な動作パターンを学習により取得するためのアルゴリズムを提案する. 2. ロボットのための予測と意志決定アルゴリズム:対戦相手の戦略を適応的に学習により取得するアルゴリズムと並行して,相手の戦略ごとに最適戦略を学習するための手法を開発する.また,対戦相手の状態をリアルタイムでモニタすることで,ゲームの状況をコントロールする手法を開発する。具体的には,対戦相手が攻撃的か防御的かどうかの判定による戦略変更,また,ロボット側にあえてすきを作ることにより,対戦相手の意思決定を能動的に誘導することを目指す。また,開発したアルゴリズムをチャンバラなどの他のロボットへ適用させることを目指す.
|
Remarks |
本研究で開発したロボットの動作を説明する動画を掲載している.
|
Research Products
(8 results)