2015 Fiscal Year Research-status Report
ビッグデータを用いた機械学習に適した最適化アルゴリズムとアーキテクチャの構成
Project/Area Number |
26730114
|
Research Institution | The University of Tokyo |
Principal Investigator |
松島 慎 東京大学, 情報理工学(系)研究科, 助教 (90721837)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 機械学習 / データマイニング / 大規模学習 / スパース学習 |
Outline of Annual Research Achievements |
研究計画で示していたデータ量を抑えながらスパース学習が可能であるスキームを考案、実装し、その有効性を示した。 具体的には、従来は非線形識別でしか達成できないほどの高次元写像を特徴抽出アルゴリズムを別のプロセスで処理することによりデータ行列を前もって計算する場合は数TB に上るような場合の学習に対しても生データから効率的に学習が可能である事を明らかにした。 特に、テキストデータやDNAデータなどでは部分文字列の特徴量を用いた学習が効率的に行えることを実験により示し、成果を国際会議の発表論文としてまとめた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究計画で示していたデータ量を抑えながらスパース学習が可能であるスキームを考案、実装し、その有効性を示すことができた。
|
Strategy for Future Research Activity |
研究計画段階で示していたように、データを格納する形式を検討することによりさらなる大規模化及び効率化をはかる。必要に応じて汎用KVSデータベースの使用を検討する。
|