研究課題/領域番号 |
25330266
|
研究機関 | 慶應義塾大学 |
研究代表者 |
櫻井 彰人 慶應義塾大学, 理工学部, 教授 (00303339)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | 機械学習 |
研究実績の概要 |
事前準備として、また、本研究に含まれる記述言語の仕様や得られるべきパターンに関する知識を得るため、実データに対する学習・予測の研究を続けている。対象を金融時系列とし、様々な機械学習手法を用いた予測を行った。主に記述方法の汎用性を計るために、複数の金融時系列に対し、予測に用いるパターンの共通性を探った。具体的なパラメータ値は異なるものの、株価、原油、外国為替において、取引規則で記述されるような非線形パターンが有効であることが分かった。なお、データ源については、複数を用いる方がよいことも分かった。それは他の市場であったり、同じ時系列の複数時間枠を用いて得られる特徴量であったりする。後者については、時系列に存在する(但し、近似的に)と考えられるフラクタル性に基づくものである。これらの成果は、3編の論文として国際誌に採択された。 記述言語については、機械学習を可能とする記述体系を考えなければならない。提案時には明確にできなかった課題の発見と解決方法の案出ができた。本研究の提案時の枠組みでは、学習すべき述語は、生成規則を用いて記述され、特に、その性質による区別は考慮していなかった。しかし、それでは機械学習を行うこと、および機械学習を行う処理系を実装することが困難であることが分かった。 一つの解決策として、学習すべき述語を階層化することを考え付いた。データに近い方から階層化するのがよく、従って最下層は学習データに関する述語であり、抽象度が上がるに従い浅くなる階層とするのがよい。再帰的記述から自然に導かれる階層とこの階層とは、順序は保存されるが、対応はしない。従って、生成規則内に記述する必要があることが分かった。 今年度の計画に、記述方法の再定義と再実装を含める。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
提案時予想しなかった課題を発見したため。課題は、対象記述に用いられる述語を学習させる枠組みを考えた場合、それらを一括して学習するアルゴリズムを考案することが困難なことである。本年度に案出した解決方法は、当該述語群を階層化することである。特に、データに直接対応する述語と、それに関する記述とを分けることが重要であるとともに、有効であることが分かった。ここに至るまで、いくつかの代替案を検討したが、それに時間を費やした。 この階層化により、自然言語処理におけるトピックモデルやニューラルネットワークの一形態であるDeep Learning Networkとの対応がとれるようになり、新しい展開が図られうるという副産物が得られた。
|
今後の研究の推進方策 |
基本的には、当初計画に沿って進める。 遅れの原因となった、述語の学習の困難さという課題とその解決策の案出に関しては、結果として、自然言語処理のトピックモデルやニューラルネットワークの一形態であるDeep Learning Network との対応関係が得られることとなり、本研究課題の深化、新たな研究課題への発展可能性という副産物が得られることとなった。
|
次年度使用額が生じた理由 |
実験用データ購入に際し、価格上昇により予算を超過した。そのため、一部の購入を次年度に他データと一括購入することとしたため。
|
次年度使用額の使用計画 |
当初予定のデータの購入に充当する
|