2010 Fiscal Year Annual Research Report
遺伝的ネットワークプログラミングによる知識発見とその応用に関する研究
Project/Area Number |
21700261
|
Research Institution | Waseda University |
Principal Investigator |
間普 真吾 早稲田大学, 理工学術院, 助教 (70434321)
|
Keywords | 遺伝アルゴリズム / プログラム生成 / データマイニング |
Research Abstract |
本年度は、遺伝的ネットワークプログラミング(GNP)のアルゴリズムに関する研究と、その応用システムへの展開および性能検証を以下のように実施した。 GNP with Rule Accumulation(GNP-RA)の株式売買モデルへの展開 GNP-RAはGNPのプログラムが抽出する行動ルールをプールし、ルールプールの情報に基づいて行動決定をする手法であるが、本年度はこれを株式売買モデルへ展開するためのアルゴリズムの改良を行った。まず訓練データで、上昇トレンドと下降トレンドの判定を行い、それぞれに対応する買いルールと売りルールを抽出する。テストシミュレーションでは、トレンドを判定し、対応するルールに基づいて売買決定を行う。また、ルール抽出で強化学習を導入し、多くの有用なルールを抽出することを試みた。その結果、強化学習なしのGNP-RAと比べて抽出ルール数が3倍程度多くなった。テストシミュレーションの結果、提案手法は、強化学習なしのGNP-RA、Rule Accumulationを行わない従来の強化学習付きGNP、Buy&Holdと比較して最も良い利益率を示した。 テスト環境でのオンライン適応力に優れたGNP with Reinforcement Learningの性能検証 GNPは訓練環境でプログラムを進化させ、それを未知のテスト環境で実行させるため、環境変動に対する適応力は重要である。したがって、本研究では小型移動ロボットの行動ルール生成を例に、環境の変化にも適応できるGNP with Reinforcement Learning(GNP-RL)の性能検証を行った。実験の結果、従来のGNPでは、環境変化が大きくなるにつれて性能低下が顕著であったが、GNP-RLはオンライン学習によるプログラムの適応機能によって性能低下を低減し、継続稼働が可能であることが分かった。
|