研究課題/領域番号 |
26730114
|
研究機関 | 東京大学 |
研究代表者 |
松島 慎 東京大学, 情報理工学(系)研究科, 助教 (90721837)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 機械学習 / ビッグデータ / 国際情報交換 |
研究実績の概要 |
機械学習手法をより大規模なデータに適用するために、本研究ではビッグデータに適した最適化アルゴリズムとアーキテクチャの構成を行う事を目的とする。具体的にはDual Cached Loopsのさらなる大規模化とスパース学習へのDual Cached Loopsの拡張を目指す。 本年度はDual Cached Loopsのさらなる大規模化の基盤となる最適化アルゴリズムの開発・実装および論文執筆を行い、スパース学習へのDual Cached Loopsの拡張に関して最適化アルゴリズムの開発・実装をおこなった。 前者のアルゴリズムについては新規性が高く、単一マシンのみでなく、複数マシンにまたがる場合でも応用可能であり、当該アルゴリズムの実装を行い、有用性を確認し概要を日本応用数理学会の2014年度年会にて発表し、論文を投稿予定である。 後者に関しては検討の結果最適化アルゴリズムとして座標降下法を採用し、これを用いたDual Cached Loopsを実装し、大規模なデータを用いてスパース学習が可能である事を確認した。さらに、これを利用して、特徴を抽出しながらの学習を行う事も可能であると考えられ、これが達成されれば実質的に大量なデータと同様の情報量を持つ少量のデータで代替しつつ学習を行う事ができ、Dual Cached Loopsのさらなる有用性を示す事ができると考えられる。現在、この方法について評価実験の段階である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
Dual Cached Loopsのさらなる大規模化に関し、基盤となる最適化アルゴリズムの開発・実装および論文執筆を行うことができた。 スパース学習へのDual Cached Loopsの拡張に関して最適化アルゴリズムの開発・実装を完了する事ができた。
|
今後の研究の推進方策 |
スパース学習を用いたDual Cached Loopsの拡張について、今年度の検討において、実質的に大量なデータと同様の情報量を持つ少量のデータで代替しつつ学習を行う事ができることがわかり。現在、この方法について評価実験の段階である。今後もこの部分に関して重点的に検討を行っていく予定である。
|