• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

強化学習を用いたサイバーフィジカルシステムのフレキシブルな開発技術

研究課題

研究課題/領域番号 16K06424
研究機関大阪府立大学

研究代表者

松本 啓之亮  大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)

研究期間 (年度) 2016-04-01 – 2019-03-31
キーワードサイバーフィジカルシステム / 機械学習 / エージェント
研究実績の概要

サイバーフィジカルシステムをその構成単位ごとに自律的に行動するマルチエージェントシステムとしてモデル化した.各エージェントの構造は知的判断部,基本機能部,ネットワーク通信関連部からなる.ネットワーク通信によりプロトコルを介して結ばれるマルチエージェントシステムについて基本機能を定義し,その機能を実装した.定義された作業が協調をとりながら実行されることを確認するためプロトコルに準拠したテストを実施した.実フィールド環境では,不確実性や計測不能な未知のパラメータが存在するため,タスクの達成方法やゴールへの到達方法を事前にあらゆる場合を想定し,あらかじめ設定することは非常に困難となる.このため本研究では試行錯誤を通して環境に適応する学習制御の枠組みである強化学習を採用した.
適用例として追跡問題に強化学習を適用した.すべてのハンタは獲物を捕まえるという共通の目的を持ち, ハンタがとれる行動はどのハンタも同じである.そのような環境において,ハンタが獲物を捕まえる際,各ハンタの適した行動は一致するものがあり, 他のハンタの行動を学習することにより,少ない試行回数で適した行動を学習できると考えられる.そこで, 本研究では他のハンタの行動履歴をもとに自身のQ値を更新する手法を考案した.実験の結果,提案手法は学習は早くなっているが, 最終的な学習結果は行動履歴を共有しない手法と比べて悪くなる傾向がある.提案手法は学習終盤に他ハンタの行動を学習したことで学習精度が劣化していると考えられる.このため,他のハンタの行動履歴を利用して学習する際の学習率をエピソード数に応じて減少させ, 学習が進むにつれて他のハンタの行動履歴による学習への影響を少なくする.これにより, 学習初期は他のハンタの行動履歴を活用し, 学習が進むと自分の履歴のみを利用した学習に近づくこととなる.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

本研究のメインテーマの一つである強化学習アルゴリズムの中核部分について先行的に検討・実施し,実現の見通しが得られた.

今後の研究の推進方策

システムのモデル化と強化学習アルゴリズムの中核部分については見通しが得られたので,これらを基礎にして通信するための分散型システムアーキテクチャの設計や各エージェントを効率よく協調させサイバーフィジカルシステムをフレキシブルに開発するためのエージェントの知的判断部のモデル駆動開発による自動生成を目指す.

次年度使用額が生じた理由

高機能なコンピュータハードウェアが新年度以降に販売されることになったので,購入時期を遅らせたため.

次年度使用額の使用計画

ネットワーク上で実用可能性を検証できる程度の規模をもつプロトタイプシステムを構築するため,サーバマシン,クライアントマシンおよびネットワーク部品等を購入する.

  • 研究成果

    (8件)

すべて 2016

すべて 雑誌論文 (3件) (うち査読あり 3件、 謝辞記載あり 1件) 学会発表 (5件) (うち国際学会 1件)

  • [雑誌論文] 劣個体分布に基づく DII analysis の提案と応用2016

    • 著者名/発表者名
      長谷川拓,井上和之.荒木悠太,森直樹,松本啓之亮
    • 雑誌名

      進化計算学会論文誌

      巻: Vol. 7 ページ: 13-23

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Analysis of Parameter-less Population Pyramid on the Local Distribution of Inferior Individuals2016

    • 著者名/発表者名
      T. Hasegawa, Y. Araki, N. Mori and K. Matsumoto
    • 雑誌名

      Intelligent and Evolutionary Systems - Adaptation, Learning and Optimization

      巻: 8 ページ: 149-164

    • 査読あり
  • [雑誌論文] CMA-ES with Surrogate Model Adapting to Fitness Landscape2016

    • 著者名/発表者名
      K. Tsukada, T. Hasegawa, N. Mori and K. Matsumoto
    • 雑誌名

      Intelligent and Evolutionary Systems - Adaptation, Learning and Optimization

      巻: 8 ページ: 417-429

    • 査読あり
  • [学会発表] Learning Method by Sharing Activity Logs in Multiagent Environment2016

    • 著者名/発表者名
      K. Matsumoto, T. Gohara, and N. Mori
    • 学会等名
      10th International Conference on Advanced Engineering Computing and Applications in Sciences
    • 発表場所
      Venice, Italy
    • 年月日
      2016-10-09 – 2016-10-13
    • 国際学会
  • [学会発表] 株式市場における人工市場と現実市場の類似度指標についての考察2016

    • 著者名/発表者名
      住田和也,松本啓之亮,森直樹
    • 学会等名
      電気学会 電子・情報・システム部門大会
    • 発表場所
      神戸大学 (兵庫県神戸市)
    • 年月日
      2016-08-31 – 2016-09-03
  • [学会発表] アクティビティ図の再利用のための検索法2016

    • 著者名/発表者名
      丸本晃大,松本啓之亮,森直樹
    • 学会等名
      第60回システム制御情報学会研究発表講演会
    • 発表場所
      京都テルサ (京都府京都市)
    • 年月日
      2016-05-25 – 2016-05-27
  • [学会発表] 単語と画像の印象的相関関係に基づく顔画像生成システム2016

    • 著者名/発表者名
      山本元気,松本啓之亮,森直樹
    • 学会等名
      第60回システム制御情報学会研究発表講演会
    • 発表場所
      京都テルサ (京都府京都市)
    • 年月日
      2016-05-25 – 2016-05-27
  • [学会発表] 株価データの解析におけるDeep Learningの導入2016

    • 著者名/発表者名
      住田和也,松本啓之亮,森直樹
    • 学会等名
      第60回システム制御情報学会研究発表講演会
    • 発表場所
      京都テルサ (京都府京都市)
    • 年月日
      2016-05-25 – 2016-05-27

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi