2017 Fiscal Year Research-status Report
一人乗り電気自動車を対象とした不整地走行戦略の自動学習システムの研究
Project/Area Number |
17K00364
|
Research Institution | Wakayama University |
Principal Investigator |
中村 恭之 和歌山大学, システム工学部, 教授 (50291969)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 不整地環境モデリング / GAN / NEAT |
Outline of Annual Research Achievements |
本研究課題では,平坦な道路,起伏の大きな段差や数段の階段といった様々な走行状況に適した,一人乗り電気自動車(PMV)の動作手順(車輪と脚の行動の組合せの生成)を自動学習する手法の完成を目指している.H29年度は,この手法を完成させるために,次の2つ手法について検討した. 1.PMVの周囲環境を三次元レーザースキャナ(以後,3D Lidarと記す)によりセンシングし,計測された三次元データによる周囲環境の把握手法.2.獲得された周囲環境の三次元データから,脚を設置する場所の候補地点を自動発見する手法 1.に関して実装を進めていたところ,当初検討していた手法では,疎な三次元データ(点群データ)しか得ることができず,走行環境の正確な三次元の面データが得られないため,2.の手法を実現する上で不都合であることが判明した.そのため,より密な三次元データ(点群データ)を得た後,三次元の面データを生成する必要がある.最近の研究動向の調査の結果,3D Lidarから得られる疎な三次元データを,GAN(Generative Adversarial Network)という手法を用いることで,密な三次元データを生成することが可能であるという見通しを得た. 2.の自動発見法に関しては,NEAT(NeuroEvolution of Augmenting Topologies)という手法を改良して,まずは,平面上で4輪タイプの自動車の経路内の自動走行が実現可能であるか検証した.ここで開発した手法では,オリジナルのNEATという手法に,従来からの強化学習法で用いられているような経験強化(失敗した経験を保持し,そのような行動を取らないようにする)の仕組みを取り入れた.この改良したNEAT法により,経路内を自動走行するための動作手順を自動獲得することが可能であることを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究で開発予定の手法1については,当初は3D Lidarから得られた点群データを統合して,その大量の点群データを用いることを想定していた.しかし,このままでは点群データの密度が疎であるため,三次元の面データを生成する際に曖昧さが生じてしまう.より正確な三次元の面データを生成するためには,密な点群データが必要である.そこで,H29年度後半に,3D Lidarからの点群データと同時取得されるカメラからの画像データを基に密な点群データを生成するという発想を得た.現在のところ,実装に用いる各種ライブラリ(深層学習用,画像取得用,結果表示用等)の準備は整っているが,この手法の実装はH29年度中に完了していない. 本研究で開発予定の手法2に関しては,想定しているPMVの構造を簡略化した移動機構での動作手順の自動獲得は可能になっているが,階段を含めた平地以外の走行環境を踏破できる機構を有するPMVを用いた実装はまだ完成していない. 階段を含めた平地以外の走行環境やPMVの移動機構や動力学計算を,計算機内で正確にシミュレートするソフトウェアが必要である. 現在のところ,実装に用いる各種ライブラリ(モデル表示用,衝突検出用,動力学計算用等)の準備は整っているが,これらのライブラリを利用して,実装する過程で時間を要している.
|
Strategy for Future Research Activity |
本研究で開発予定の手法1の実装方法については,既に調査済みであるため,H30年度の前半での手法1の実装の完成を目指す.実装が完了した後(H30年度後半)は,まずは,一定勾配の坂道環境,次に,平坦な通路と1つの段差を含む環境,最後に,平坦な通路と数段の階段を含む環境において,実装した手法により三次元の面データを生成して,その正確性について検証する.検証の結果,改善が必要であれば,その問題点を解決する方法について検討する. 本研究で開発予定の手法2に関しては,階段を含めた平地以外の走行環境や,PMVの動力学計算をシミュレートするソフトウェアの開発を引き続き行い,年内の完成を目指す. また,H29年度に開発した手法は,汎化性能(学習に用いたデータ以外の環境においても,学習によって獲得した性能を発揮できる能力)に関して,その性能が十分でない場合があるため,別の動作手順の自動獲得方法について調査研究する予定である.近年,開発が盛んに行われている(深層)強化学習アルゴリズム (DQN, Double DQN, Dueling Networks, Prioritized Experience Replay Multi-step Learning, Distributional RLなど) や,方策ベースの強化学習アルゴリズム (REINFORCE, DDQN, A3C, ACER, TRPO, PPOなど)などが本開発に適用可能か調査する予定である.
|
Causes of Carryover |
次年度使用額が生じたのは,H29年度に購入した機器の価格が当初予定した金額よりも少額であったからである. H30年度に使用する予定の研究費を用いて,大量の三次元計測データから生成される三次元の面データや仮想的なPMVのモデルをシミュレートするために,大容量のメモリを搭載した高性能計算機を使用する予定であり,このようなGPUを搭載した高性能計算機を購入するために使用する.また,H29年度に購入した3D Lidarを実際にPMVに搭載するために必要な,機械部品,電子部品等を購入する予定である. H30年度中に研究成果を発表するためや,類似研究の調査のための旅費を支出する予定である.
|
Remarks |
シェライス ミカエル:進化計算問題に対する能動的回避学習法に関する研究,和歌山大学大学院システム工学研究科 2017年度修士論文
|