• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

協調学習アルゴリズムを用いた公正なシステム運用方式の獲得技術

Research Project

Project/Area Number 24560501
Research InstitutionOsaka Prefecture University

Principal Investigator

松本 啓之亮  大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)

Keywords機械学習 / 協調学習 / エージェント
Research Abstract

協調学習の適用例として追跡問題に強化学習を適用した.完全知覚学習と呼ばれる学習法で学習すると,エージェントの数が多くなるにつれて状態数の爆発が起こってしまうという問題がある.そこで,着目するエージェントの数を2 体に限定することにより,状態数を減らして強化学習の速度を速くした.しかし,問題として知覚精度を下げて得られる知識を減らしていることにより,学習の後期における行動選択の精度が低下することが挙げられる.そのため,長期的な性能は完全知覚学習と比較すると劣ってしまう.そこで,切り換え学習を用いる.強化学習において,特に時間のかかる初期の学習を知覚精度を下げて高速化し,ある程度学習が進んだ段階で完全知覚に戻すことを考える.ここで,初期の知覚精度を下げた影響は完全になくならないため,行動判断の精度を完全に保つことはできない.この問題を解決するために学習を切り換えるための,適切なタイミングを得るのにゴールデンクロスを利用した.
ゴールデンクロスとは,移動平均線を利用したチャート分析の一つである.短期の移動平均線が長期の移動平均線を下から上に突き抜けるようなチャートを指す.株価分析によく用いられ,ゴールデンクロスが見られると短期の買い需要が高まっていることを示し,買いのサインとされる.このように,ゴールデンクロスは過去のデータを利用して数値上昇予測をしており,下に凸であるグラフの上昇部分の検出に優れている.株価分析に用いるのが主流であるが,学習精度が劣化して捕獲ステップ数が増加するタイミングを見つけるのにも相性が良いと考えられる.このゴールデンクロスを利用した切り換え学習法を考案した.その後,適用実験を通して適切な切り換えタイミングを確認し,提案手法が設定された学習率・割引率に応じて柔軟に適切な切り換えタイミングを自動検出し,切り換え学習により効率的な学習ができることを示した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

昨年度,一部先行的に検討していた本研究のメインテーマの一つである協調学習アルゴリズムをゴールデンクロスを用いた切り換え学習により確立した.これを基礎にしてプロトコルを通信するための分散型システムアーキテクチャを設計した.

Strategy for Future Research Activity

分散型システムアーキテクチャにより,各エージェントを効率よく協調させて,公正なシステム運用方式を獲得するためのエージェントの知的判断部を実現する.さらにこれらをシステムとしてまとめ,プロトタイプシステムを構築し,シミュレーションによる評価を目指す.

Expenditure Plans for the Next FY Research Funding

分散型システムアーキテクチャにより,各エージェントを効率よく協調させて,公正なシステム運用方式を獲得する協調学習法であるQ 学習を十分確立し検証するために,協調学習の典型的なベンチマークである追跡問題を例に徹底的にアルゴリズムを見直した.このため,プロトタイプシステムの構築が来年度となった.
エージェントの知的判断部を実現してシステムとしてまとめ,プロトタイプシステムを構築し,シミュレーションによる評価を目指す.ネットワーク上で実用可能性を検証できる程度の規模をもつプロトタイプシステムを構築するため,クライアントマシンおよびネットワーク部品等を購入する.

  • Research Products

    (11 results)

All 2014 2013 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (8 results)

  • [Journal Article] 追跡問題におけるゴールデンクロスを利用した切り換えQ学習2014

    • Author(s)
      伊木美太輔,松本啓之亮,森直樹
    • Journal Title

      電気学会論文誌C

      Volume: 134 Pages: 印刷中

    • Peer Reviewed
  • [Journal Article] A Supporting System for Cloud Service Integration Based on User Profiles2013

    • Author(s)
      T. Okabe, K. Matsumoto, and N. Mori
    • Journal Title

      Electrical Engineering in Japan

      Volume: 96 Pages: 14-22

    • DOI

      10.1002/ecj.11444

    • Peer Reviewed
  • [Journal Article] モデル駆動ソフトウェア開発へのコンポーネントベース技術の適用2013

    • Author(s)
      水野友貴,松本啓之亮,森直樹
    • Journal Title

      電気学会論文誌C

      Volume: 133 Pages: 2275-2281

    • DOI

      10.1541/ieejeiss.133.2275

    • Peer Reviewed
  • [Presentation] A Method of Applying Component-Based Software Technologies to Model Driven Development2014

    • Author(s)
      K. Matsumoto, T. Mizuno, and N. Mori
    • Organizer
      The Third International Conference on Intelligent Systems and Applications
    • Place of Presentation
      Seville, Spain
    • Year and Date
      2014-06-22 – 2014-06-26
  • [Presentation] A Switching Q-Learning Approach Focusing on Partial States

    • Author(s)
      K. Matsumoto, T. Ikimi, and N. Mori
    • Organizer
      2013 IFAC Conference on Manufacturing Modelling, Management, and Control
    • Place of Presentation
      Saint Petersburg, Russia
  • [Presentation] 追跡問題におけるゴールデンクロスを利用したQ 学習

    • Author(s)
      伊木美太輔,松本啓之亮,森直樹,後原拓弥
    • Organizer
      第57回システム制御情報学会研究発表講演会
    • Place of Presentation
      兵庫県民会館
  • [Presentation] アクティビティ図から実行可能コードへの自動生成

    • Author(s)
      名越公昭, 松本啓之亮, 森直樹
    • Organizer
      第57回システム制御情報学会研究発表講演会
    • Place of Presentation
      兵庫県民会館
  • [Presentation] アクティビティ図へのラウンドトリップエンジニアリング実装

    • Author(s)
      上西諒, 松本啓之亮, 森直樹
    • Organizer
      第57回システム制御情報学会研究発表講演会
    • Place of Presentation
      兵庫県民会館
  • [Presentation] モデルコーパスを用いたアクティビティ図の再利用支援

    • Author(s)
      清原貴史,松本啓之亮,森直樹
    • Organizer
      第57回システム制御情報学会研究発表講演会
    • Place of Presentation
      兵庫県民会館
  • [Presentation] 追跡問題におけるエージェントQ 学習の中央集権化

    • Author(s)
      後原拓弥,松本啓之亮,森直樹
    • Organizer
      第58回システム制御情報学会研究発表講演会
    • Place of Presentation
      京都テルサ
  • [Presentation] アクティビティ図の再利用支援手法における検索法の改善の提案

    • Author(s)
      清原貴史,松本啓之亮,森直樹
    • Organizer
      第58回システム制御情報学会研究発表講演会
    • Place of Presentation
      京都テルサ

URL: 

Published: 2015-05-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi