研究課題/領域番号 |
19K20336
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
松島 慎 東京大学, 大学院情報理工学系研究科, 准教授 (90721837)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 機械学習 / 凸最適化 / クラスタリング / 部分空間クラスタリング / 統計的機械学習 |
研究開始時の研究の概要 |
部分空間クラスタリングは類似度行列の学習を介することで、部分空間という複雑な構造に基づくクラスタリングを厳密な理論保証の下で可能にする。本研究課題における学術的問いは「部分空間クラスタリング手法はいかに効率的に大規模データを扱うことができるか」であり、これを探るため、以下の項目に対する研究を行う。 ●大規模部分空間クラスタリングのための汎用計算機に特化された凸最適化スキームの構築 ●部分空間クラスタリングの大規模アルゴリズムの理論保証 スパース性や低ランク性などを利用することでいかに大規模なデータから効率的な学習が可能であるかを、実験的立場と理論的立場の両方から明らかにする。
|
研究成果の概要 |
本研究の目的は大規模部分空間クラスタリングのための凸最適化スキームの構築とその理論保証である。 本研究ではS5Cと呼ばれる大規模部分空間クラスタリングのためのアルゴリズムを開発した。従来はデータ数の二乗以上の計算量が必要である学習を、本提案アルゴリズ ムではデータ数に比例する計算量で達成できることを実験的にも理論的にも示した。本研究成果は機械学習の最も重要な国際会議の一つであるThirty-Third Conference on Neural Information Processing Systemsに採択され、バンクーバーにて発表を行った。
|
研究成果の学術的意義や社会的意義 |
部分空間クラスタリングは理論保証が難しいクラスタリング手法において理論的に美しい結果が知られているという意味で有意義な手法である。本研究ではこの部分空間クラスタリングが大規模データにも適用可能であることを示し、実験的にも有効性を検証した点に学術的な意義がある。部分空間クラスタリングに関する研究が機械学習の主要な国際会議に採択されたことで、機械学習の発展には実用性だけではなく理論的な美しさも重要であるという理念の補強の一助となったことにも社会的な意義があると考えられる。
|