現代のビッグデータには、以下の2つの特徴がある。1,高次元データ(例えば、ユーザx商品x時間という購買データ)、2、モードを共有する複数データ(例えば、上記高次元データに、ユーザ間の情報を加えれば、ユーザというモードを共有する)。そこで、モードを共有する複数高次元データから、内在する因子を効率的に抽出するための、なるたけ一般的な手法を構築した。具体的には、複数高次元データを表現可能なノルムを、効率的な学習が可能なように開発し、その性質を解析するとともに、性能の優位性を実験的に示した。また、開発経験を活かし、高次元データと行列に関する様々な問題への解決手法を提案し、性能を応用において実証した。
|