研究課題/領域番号 |
26730114
|
研究機関 | 東京大学 |
研究代表者 |
松島 慎 東京大学, 情報理工学(系)研究科, 助教 (90721837)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 機械学習 / データマイニング / 大規模学習 / スパース学習 |
研究実績の概要 |
研究計画で示していたデータ量を抑えながらスパース学習が可能であるスキームを考案、実装し、その有効性を示した。 具体的には、従来は非線形識別でしか達成できないほどの高次元写像を特徴抽出アルゴリズムを別のプロセスで処理することによりデータ行列を前もって計算する場合は数TB に上るような場合の学習に対しても生データから効率的に学習が可能である事を明らかにした。 特に、テキストデータやDNAデータなどでは部分文字列の特徴量を用いた学習が効率的に行えることを実験により示し、成果を国際会議の発表論文としてまとめた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画で示していたデータ量を抑えながらスパース学習が可能であるスキームを考案、実装し、その有効性を示すことができた。
|
今後の研究の推進方策 |
研究計画段階で示していたように、データを格納する形式を検討することによりさらなる大規模化及び効率化をはかる。必要に応じて汎用KVSデータベースの使用を検討する。
|