本研究では第一にSVMやロジスティック回帰などを包含する正則化付き経験リスク最初化問題について、複数のプロセスが非同期的に動作することで最適化を行うことができるスキームを提案、効率的な分散学習が行えることを理論・実験の両面から示した。 第二に、従来では数TBのデータを用いなければ学習できないスパース学習について、扱うデータ量を抑えながらスパース学習が可能であるスキームを提案した。提案手法はテキストデータやDNA配列データなどでは部分文字列の特徴量を用いた学習に関して、接尾辞配列などの効率的なデータ構造を用いる事によって、部分文字列に対応する特徴を効率よく抽出する事が可能であることを示した。
|