2013 年度実施状況報告書

協調学習アルゴリズムを用いた公正なシステム運用方式の獲得技術

研究課題

研究課題/領域番号	24560501
研究機関	大阪府立大学
研究代表者	松本啓之亮大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)
キーワード	機械学習 / 協調学習 / エージェント
研究概要	協調学習の適用例として追跡問題に強化学習を適用した．完全知覚学習と呼ばれる学習法で学習すると，エージェントの数が多くなるにつれて状態数の爆発が起こってしまうという問題がある．そこで，着目するエージェントの数を2 体に限定することにより，状態数を減らして強化学習の速度を速くした．しかし，問題として知覚精度を下げて得られる知識を減らしていることにより，学習の後期における行動選択の精度が低下することが挙げられる．そのため，長期的な性能は完全知覚学習と比較すると劣ってしまう．そこで，切り換え学習を用いる．強化学習において，特に時間のかかる初期の学習を知覚精度を下げて高速化し，ある程度学習が進んだ段階で完全知覚に戻すことを考える．ここで，初期の知覚精度を下げた影響は完全になくならないため，行動判断の精度を完全に保つことはできない．この問題を解決するために学習を切り換えるための，適切なタイミングを得るのにゴールデンクロスを利用した．ゴールデンクロスとは，移動平均線を利用したチャート分析の一つである．短期の移動平均線が長期の移動平均線を下から上に突き抜けるようなチャートを指す．株価分析によく用いられ，ゴールデンクロスが見られると短期の買い需要が高まっていることを示し，買いのサインとされる．このように，ゴールデンクロスは過去のデータを利用して数値上昇予測をしており，下に凸であるグラフの上昇部分の検出に優れている．株価分析に用いるのが主流であるが，学習精度が劣化して捕獲ステップ数が増加するタイミングを見つけるのにも相性が良いと考えられる．このゴールデンクロスを利用した切り換え学習法を考案した．その後，適用実験を通して適切な切り換えタイミングを確認し，提案手法が設定された学習率・割引率に応じて柔軟に適切な切り換えタイミングを自動検出し，切り換え学習により効率的な学習ができることを示した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由昨年度，一部先行的に検討していた本研究のメインテーマの一つである協調学習アルゴリズムをゴールデンクロスを用いた切り換え学習により確立した．これを基礎にしてプロトコルを通信するための分散型システムアーキテクチャを設計した．
今後の研究の推進方策	分散型システムアーキテクチャにより，各エージェントを効率よく協調させて，公正なシステム運用方式を獲得するためのエージェントの知的判断部を実現する．さらにこれらをシステムとしてまとめ，プロトタイプシステムを構築し，シミュレーションによる評価を目指す．
次年度の研究費の使用計画	分散型システムアーキテクチャにより，各エージェントを効率よく協調させて，公正なシステム運用方式を獲得する協調学習法であるQ 学習を十分確立し検証するために，協調学習の典型的なベンチマークである追跡問題を例に徹底的にアルゴリズムを見直した．このため，プロトタイプシステムの構築が来年度となった．エージェントの知的判断部を実現してシステムとしてまとめ，プロトタイプシステムを構築し，シミュレーションによる評価を目指す．ネットワーク上で実用可能性を検証できる程度の規模をもつプロトタイプシステムを構築するため，クライアントマシンおよびネットワーク部品等を購入する．

研究成果
(11件)

すべて 2014 2013 その他

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (8件)

[雑誌論文] 追跡問題におけるゴールデンクロスを利用した切り換えQ学習2014
- 著者名/発表者名
  伊木美太輔，松本啓之亮，森直樹
- 雑誌名
  
  電気学会論文誌C
  
  巻: 134 ページ: 印刷中
- 査読あり
[雑誌論文] A Supporting System for Cloud Service Integration Based on User Profiles2013
- 著者名/発表者名
  T. Okabe, K. Matsumoto, and N. Mori
- 雑誌名
  
  Electrical Engineering in Japan
  
  巻: 96 ページ: 14-22
- DOI
  10.1002/ecj.11444
- 査読あり
[雑誌論文] モデル駆動ソフトウェア開発へのコンポーネントベース技術の適用2013
- 著者名/発表者名
  水野友貴，松本啓之亮，森直樹
- 雑誌名
  
  電気学会論文誌C
  
  巻: 133 ページ: 2275-2281
- DOI
  10.1541/ieejeiss.133.2275
- 査読あり
[学会発表] A Method of Applying Component-Based Software Technologies to Model Driven Development2014
- 著者名/発表者名
  K. Matsumoto, T. Mizuno, and N. Mori
- 学会等名
  The Third International Conference on Intelligent Systems and Applications
- 発表場所
  Seville, Spain
- 年月日
  2014-06-22 – 2014-06-26
[学会発表] A Switching Q-Learning Approach Focusing on Partial States
- 著者名/発表者名
  K. Matsumoto, T. Ikimi, and N. Mori
- 学会等名
  2013 IFAC Conference on Manufacturing Modelling, Management, and Control
- 発表場所
  Saint Petersburg, Russia
[学会発表] 追跡問題におけるゴールデンクロスを利用したQ 学習
- 著者名/発表者名
  伊木美太輔，松本啓之亮，森直樹，後原拓弥
- 学会等名
  第57回システム制御情報学会研究発表講演会
- 発表場所
  兵庫県民会館
[学会発表] アクティビティ図から実行可能コードへの自動生成
- 著者名/発表者名
  名越公昭, 松本啓之亮, 森直樹
- 学会等名
  第57回システム制御情報学会研究発表講演会
- 発表場所
  兵庫県民会館
[学会発表] アクティビティ図へのラウンドトリップエンジニアリング実装
- 著者名/発表者名
  上西諒, 松本啓之亮, 森直樹
- 学会等名
  第57回システム制御情報学会研究発表講演会
- 発表場所
  兵庫県民会館
[学会発表] モデルコーパスを用いたアクティビティ図の再利用支援
- 著者名/発表者名
  清原貴史，松本啓之亮，森直樹
- 学会等名
  第57回システム制御情報学会研究発表講演会
- 発表場所
  兵庫県民会館
[学会発表] 追跡問題におけるエージェントQ 学習の中央集権化
- 著者名/発表者名
  後原拓弥，松本啓之亮，森直樹
- 学会等名
  第58回システム制御情報学会研究発表講演会
- 発表場所
  京都テルサ
[学会発表] アクティビティ図の再利用支援手法における検索法の改善の提案
- 著者名/発表者名
  清原貴史，松本啓之亮，森直樹
- 学会等名
  第58回システム制御情報学会研究発表講演会
- 発表場所
  京都テルサ

2013 年度 実施状況報告書

協調学習アルゴリズムを用いた公正なシステム運用方式の獲得技術

研究代表者

松本 啓之亮 大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 追跡問題におけるゴールデンクロスを利用した切り換えQ学習2014

著者名/発表者名

雑誌名

[雑誌論文] A Supporting System for Cloud Service Integration Based on User Profiles2013

著者名/発表者名

雑誌名

DOI

[雑誌論文] モデル駆動ソフトウェア開発へのコンポーネントベース技術の適用2013

著者名/発表者名

雑誌名

DOI

[学会発表] A Method of Applying Component-Based Software Technologies to Model Driven Development2014

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] A Switching Q-Learning Approach Focusing on Partial States

著者名/発表者名

学会等名

発表場所

[学会発表] 追跡問題におけるゴールデンクロスを利用したQ 学習

著者名/発表者名

学会等名

発表場所

[学会発表] アクティビティ図から実行可能コードへの自動生成

著者名/発表者名

学会等名

発表場所

[学会発表] アクティビティ図へのラウンドトリップエンジニアリング実装

著者名/発表者名

学会等名

発表場所

[学会発表] モデルコーパスを用いたアクティビティ図の再利用支援

著者名/発表者名

学会等名

発表場所

[学会発表] 追跡問題におけるエージェントQ 学習の中央集権化

著者名/発表者名

学会等名

発表場所

[学会発表] アクティビティ図の再利用支援手法における検索法の改善の提案

著者名/発表者名

学会等名

発表場所

2013 年度実施状況報告書

松本啓之亮大阪府立大学, 工学(系)研究科(研究院), 教授 (90285304)