本研究では、現代社会に急増している以下の2つの特徴を持つデータの組み合わせに着目した。 1) テンソル:従来の購買データである「ユーザ x 商品」といった行列のみならず高次元のテンソルが得られる。例えば、購買データは従来の「ユーザ × 商品」から購買履歴データとして「ユーザ × 商品 × 時間」が得られる。 2) 複数データ:上記の「ユーザ x 商品」あるいは「ユーザ x 商品 x 時間」といった購買データのみならず SNS等からユーザ間のリンク (隣接行列:「ユーザ × ユーザ」) 等が補助情報として得られ、モード (例えばユーザ) を共有する複数データ (行列) が得られる。 すなわち、これら2つの特徴を持つデータを統合的に解析する手法、具体的には「モードを共有する複数テンソルの内在構造の効率的解析手法」の構築を目指した。より詳細には、複数テンソルを表現 (近似) 可能な低ランクパラメータによるノルムを設計し、ノルムの効率的学習手法を構築した。例えば、ノルムの学習が凸最適化問題となるようノルムを設計し、かつ学習手法を構築した。さらに、手法構築のみならず学習誤差の解析から問題の包括・普遍的理解を行った。研究成果は、Machine Learning及びNeural Computation等の機械学習うの中核的学術誌の論文として発表し、テンソルの機械学習、さらには機械学習全体の発展に貢献した。
|