2019 Fiscal Year Annual Research Report
Efficient estimation of data structure from multiple tensors
Project/Area Number |
19H04169
|
Research Institution | Kyoto University |
Principal Investigator |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 機械学習 |
Outline of Annual Research Achievements |
本研究では、現代社会に急増している以下の2つの特徴を持つデータの組み合わせに着目した。 1) テンソル:従来の購買データである「ユーザ x 商品」といった行列のみならず高次元のテンソルが得られる。例えば、購買データは従来の「ユーザ × 商品」から購買履歴データとして「ユーザ × 商品 × 時間」が得られる。 2) 複数データ:上記の「ユーザ x 商品」あるいは「ユーザ x 商品 x 時間」といった購買データのみならず SNS等からユーザ間のリンク (隣接行列:「ユーザ × ユーザ」) 等が補助情報として得られ、モード (例えばユーザ) を共有する複数データ (行列) が得られる。 すなわち、これら2つの特徴を持つデータを統合的に解析する手法、具体的には「モードを共有する複数テンソルの内在構造の効率的解析手法」の構築を目指した。より詳細には、複数テンソルを表現 (近似) 可能な低ランクパラメータによるノルムを設計し、ノルムの効率的学習手法を構築した。例えば、ノルムの学習が凸最適化問題となるようノルムを設計し、かつ学習手法を構築した。さらに、手法構築のみならず学習誤差の解析から問題の包括・普遍的理解を行った。研究成果は、Machine Learning及びNeural Computation等の機械学習うの中核的学術誌の論文として発表し、テンソルの機械学習、さらには機械学習全体の発展に貢献した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
概要で記入したように、ノルムの設計及び学習手法構築、また理論的解析を当初予定していたように行うことができたため。
|
Strategy for Future Research Activity |
上記概要で述べたように、モードを共有する複数テンソル、例えば、「ユーザ × 商品 × 時間」や「ユーザ x ユーザ」を対象データとした際に、いずれのデータも非常に疎(スパース)なデータという特徴がある。従って、モードを共有する複数テンソルに対し、スパース性を考慮した機械学習手法の構築を検討する予定である。
|