2014 Fiscal Year Research-status Report
ビッグデータを用いた機械学習に適した最適化アルゴリズムとアーキテクチャの構成
Project/Area Number |
26730114
|
Research Institution | The University of Tokyo |
Principal Investigator |
松島 慎 東京大学, 情報理工学(系)研究科, 助教 (90721837)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 機械学習 / ビッグデータ / 国際情報交換 |
Outline of Annual Research Achievements |
機械学習手法をより大規模なデータに適用するために、本研究ではビッグデータに適した最適化アルゴリズムとアーキテクチャの構成を行う事を目的とする。具体的にはDual Cached Loopsのさらなる大規模化とスパース学習へのDual Cached Loopsの拡張を目指す。 本年度はDual Cached Loopsのさらなる大規模化の基盤となる最適化アルゴリズムの開発・実装および論文執筆を行い、スパース学習へのDual Cached Loopsの拡張に関して最適化アルゴリズムの開発・実装をおこなった。 前者のアルゴリズムについては新規性が高く、単一マシンのみでなく、複数マシンにまたがる場合でも応用可能であり、当該アルゴリズムの実装を行い、有用性を確認し概要を日本応用数理学会の2014年度年会にて発表し、論文を投稿予定である。 後者に関しては検討の結果最適化アルゴリズムとして座標降下法を採用し、これを用いたDual Cached Loopsを実装し、大規模なデータを用いてスパース学習が可能である事を確認した。さらに、これを利用して、特徴を抽出しながらの学習を行う事も可能であると考えられ、これが達成されれば実質的に大量なデータと同様の情報量を持つ少量のデータで代替しつつ学習を行う事ができ、Dual Cached Loopsのさらなる有用性を示す事ができると考えられる。現在、この方法について評価実験の段階である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
Dual Cached Loopsのさらなる大規模化に関し、基盤となる最適化アルゴリズムの開発・実装および論文執筆を行うことができた。 スパース学習へのDual Cached Loopsの拡張に関して最適化アルゴリズムの開発・実装を完了する事ができた。
|
Strategy for Future Research Activity |
スパース学習を用いたDual Cached Loopsの拡張について、今年度の検討において、実質的に大量なデータと同様の情報量を持つ少量のデータで代替しつつ学習を行う事ができることがわかり。現在、この方法について評価実験の段階である。今後もこの部分に関して重点的に検討を行っていく予定である。
|