2018 Fiscal Year Annual Research Report
Estimating the factor structure in multiple matrices
Project/Area Number |
16H02868
|
Research Institution | Kyoto University |
Principal Investigator |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 機械学習 |
Outline of Annual Research Achievements |
様々な応用で、データは、行や列の項目を互いに共有する複数の行列として与えられる。例えば、EC(electronic commerce)サイトのデータは、メインデータが顧客(ユーザ)と商品(アイテム)の行列だが、それのみならずさらに顧客同士、商品同士の関係を表現する行列をデータとして得ることができる。他の例では、患者に対する薬の投与では、投与結果が患者と薬の行列としてメインデータとなり、さらに薬同士の相同性を表す行列をデータとして取得可能である。メインデータに対する付加データは、サイドインフォメーションと呼ばれ、機械学習の予測精度を向上させる上で非常に重要である。 本研究の目的は、このように、メインデータのみならずサイドインフォメーションが与えられる状況、すなわち複数の行列を入力とし、行列の構造、特に因子、上記の例では、顧客と商品に関連する因子を抽出するための、一般性のある行列分解の枠組みと効率的な解決手法を構築することであった。研究実績は多岐に渡り、ここでは、2つの結果例を挙げる: 1,メインデータが行列のみならずテンソルであり、テンソルのある次元を共有する行列がサイドインフォメーションとして与えられる場合に、テンソルと行列全体を表すノルムを定義し、ノルムを効率的に学習するアルゴリズムを開発した。理論的にノルムの性質を解析すると同時に、実験的に開発アルゴリズムの有効性を人工及び実際のいくつかのデータで示した。成果は、Neural Computation誌、及び機械学習のトップ国際会議であるNeurIPSの予稿集に掲載された。 2,メインデータとサイドインフォメーションを分解し因子を抽出する問題設定に対し、確率モデルによる非常に効率的で大規模データに適用可能な手法を開発した。成果は、人工知能のトップ国際会議であるAAAIの予稿集に掲載された。
|
Research Progress Status |
平成30年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
平成30年度が最終年度であるため、記入しない。
|
-
-
-
-
-
-
-
-
-
-
[Journal Article] Factor Analysis on a Graph.2018
Author(s)
Karasuyama, M. and Mamitsuka, H.
-
Journal Title
Proceedings of the 21st International Conference on Artificial Intelligence and Statistics (AISTATS 2018)
Volume: -
Pages: 1117-1126
Peer Reviewed / Open Access
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-