• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Research-status Report

分布推定アルゴリズムの対象領域・解表現形式の拡張とその展開

Research Project

Project/Area Number 23700267
Research InstitutionOkayama University

Principal Investigator

半田 久志  岡山大学, 自然科学研究科, 助教 (60304333)

Project Period (FY) 2011-04-28 – 2014-03-31
Keywords分布推定アルゴリズム / 進化計算 / 強化学習問題 / グラフカーネル / グラフマイニング
Research Abstract

強化学習問題のための分布推定アルゴリズムEDA-RLについては,状態行動遷移系列中の冗長系列を削除するアルゴリズムの実装を行った.この冗長系列削除機構により,大規模問題にも適用可能となり,ある不完全知覚問題のクラスについては解消可能であることが判明した.これらの結果はSpringerから出版された書籍に収められることとなった. グラフカーネルを用いた分布推定アルゴリズムについては,基本アルゴリズムの実装が終了した.このアルゴリズムは,既存の進化アルゴリズムをグラフ関連問題に適用した際に顕在する1)似たような遺伝子型が全く異なった表現型をしてしまう.そして,2)鏡像解など,一見ことなった遺伝子型が,同じもしくは類似した表現型になってしまうことによる,適応度景観の凸凹さを解消できるとがわかった.この基本アルゴリズムのアイデアを台湾で開催された国際シンポジウムでKeynote speechとして紹介することができた.しかしながら,この実装では,計算量低減の副産物としてエッジが増大する方向にバイアスがかかっており,それを解消するためにはギブスサンプリングを実装する必要があることがわかった.ギブスサンプリングは計算量がかかるため,GPGPUの実装による評価を先に行う必要があることがわかり,それに関して前倒し請求を行い,GPGPUの実装に関する研究に着手することになった.これについては,現在も実装中である.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

強化学習問題のための分布推定アルゴリズムであるEDA-RLについては,冗長系列削除機構の実装とその評価が完了し,さらにその成果が十分に認められ書籍(分担執筆)の出版まで行っていることから順調な滑り出しを見せているといえる. グラフカーネルを用いた分布推定アルゴリズムについても,基本アルゴリズムの実装は完了していることから良好に進展していると考えている.

Strategy for Future Research Activity

強化学習問題のための分布推定アルゴリズムEDA-RLについて,多目的最適化の考え方を用いた多戦略の獲得について考察してくことを考えている.「グラフカーネルを用いた分布推定アルゴリズム」に関しては,GPGPUに対応させたアルゴリズムをベンチマーク問題へ適用し,GPGPU化の効果,アルゴリズムの性能検証を行う.ギブスサンプリング以外にも,計算量が少なく,かつバイアスがかからないサンプリング方法を案出する必要があると考えている.

Expenditure Plans for the Next FY Research Funding

グラフカーネルを用いた分布推定アルゴリズムの基本アルゴリズムについて,6月に開催されるWorld Congress on Computational Intelligence (WCCI 2012)にて成果発表を行う予定にしている. また,Ivy Bridge Core i7 搭載のPCを複数台購入し,PCクラスタを構築する予定にしている. さらに,次々年度の応用に向けて,他大学教員との意見交換を活発に行って行きたいと考えている.

  • Research Products

    (16 results)

All 2012 2011

All Journal Article (7 results) (of which Peer Reviewed: 5 results) Presentation (9 results)

  • [Journal Article] 確率的最適化の設計技術と適用技術2012

    • Author(s)
      染谷博司, 半田久志, 小圷 成一
    • Journal Title

      電気学会論文誌C部門誌

      Volume: Vol.131, No.1 Pages: 2-5

  • [Journal Article] Neuroevolution with manifold learning for playing Mario2012

    • Author(s)
      Hisashi Handa
    • Journal Title

      International Journal of Bio-Inspired Computation

      Volume: 4(1) Pages: 14-26

    • DOI

      110.1504/IJBIC.2012.044927

    • Peer Reviewed
  • [Journal Article] On the Effect of Dimensionality Reduction by Manifold Learning for Evolutionary Learning2011

    • Author(s)
      Hisashi Handa
    • Journal Title

      Evolving Systems

      Volume: 2(4) Pages: 235- 247

    • DOI

      10.1007/s12530-011-9036-z

    • Peer Reviewed
  • [Journal Article] GA Papers on Design of Chemical Compounds with Desired Properties2011

    • Author(s)
      Hisashi Handa
    • Journal Title

      Proc. International Workshop on Evolutionary Algorithms for Material/Nanomaterial Science

      Volume: - Pages: 79-98

  • [Journal Article] Structure Search of Probabilistic Models and Data Correction for EDA-RL2011

    • Author(s)
      Hisashi Handa
    • Journal Title

      CD-ROM Proc. 2011 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Dimensionality Reduction of Scene and Enemy Information in Mario2011

    • Author(s)
      Hisashi Handa
    • Journal Title

      Proc. 2011 IEEE Congress on Evolutionary Computation

      Volume: - Pages: 1515-1520

    • Peer Reviewed
  • [Journal Article] Evolutionary Constitution of Othello Players2011

    • Author(s)
      Hisashi Handa
    • Journal Title

      CD-ROM Proc. IES2011: The 15th International Symposium on Intelligent and Evolutionary Systems

      Volume: - Pages: -

    • Peer Reviewed
  • [Presentation] Network Design By Using Estimation of Distirbution Algorithms2012

    • Author(s)
      Hisashi Handa
    • Organizer
      2012 International Symposium on Semiconductor Manufacturing Intelligence(招待講演)
    • Place of Presentation
      国立精華大学(台湾)
    • Year and Date
      2012.1.7
  • [Presentation] オセロプレイヤの進化的構成の検討2011

    • Author(s)
      半田久志
    • Organizer
      第1 回進化計算学会研究会/第7回進化計算フロンティア研究会合同研究会
    • Place of Presentation
      東京大学(東京)
    • Year and Date
      2011.9.9
  • [Presentation] 強化学習を用いたコンピュータ将棋における状態表現に関する考察2011

    • Author(s)
      今津拓哉,半田久志,阿部匡伸
    • Organizer
      第21 回インテリジェント・システム・シンポジウム
    • Place of Presentation
      神戸大学(神戸)
    • Year and Date
      2011.9.2
  • [Presentation] 強化学習のMs.PacMan への適用2011

    • Author(s)
      半田久志
    • Organizer
      第27 回ファジィシステムシンポジウム
    • Place of Presentation
      福井大学(福井)
    • Year and Date
      2011.9.12
  • [Presentation] ゲームへの計算知能の適用2011

    • Author(s)
      半田久志
    • Organizer
      2011 IEEE SMC Hiroshima Chapter 若手研究会(招待講演)
    • Place of Presentation
      広島市立大学(広島)
    • Year and Date
      2011.7.16
  • [Presentation] 進化型多目的最適化によるゲームエージェントのスキル付加に関する考察2011

    • Author(s)
      半田久志
    • Organizer
      第55 回システム制御情報学会研究発表講演会
    • Place of Presentation
      大阪大学(大阪)
    • Year and Date
      2011.5.19
  • [Presentation] ビデオゲームのシーン情報に対する多様体学習法適用の検討2011

    • Author(s)
      半田久志
    • Organizer
      システム研究会
    • Place of Presentation
      山口大学(山口)
    • Year and Date
      2011.12.3
  • [Presentation] アンドロイド端末を用いた音声合成デバイスの構成2011

    • Author(s)
      半田久志,中谷和彦,阿部匡伸
    • Organizer
      計測自動制御学会 システム・情報部門学術講演会
    • Place of Presentation
      国立オリンピック記念青少年総合センター(東京)
    • Year and Date
      2011.11.23
  • [Presentation] 探索に基づいたソフトウェア工学2011

    • Author(s)
      半田久志
    • Organizer
      計測自動制御学会 システム・情報部門学術講演会
    • Place of Presentation
      国立オリンピック記念青少年総合センター(東京)
    • Year and Date
      2011.11.21

URL: 

Published: 2013-07-10  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi