研究課題/領域番号 |
16H02868
|
研究機関 | 京都大学 |
研究代表者 |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 行列分解 / 協調行列分解 / 機械学習 / データマイニング |
研究実績の概要 |
工学、科学をはじめとした社会の様々な応用で、データは、行や列の項目を互いに共有する複数の行列として与えられる。例えば、EC(electronic commerce)サイトのデータは、メインデータが顧客(ユーザ)と商品(アイテム)の行列だが、それのみならずさらに顧客同士、商品同士 の関係を表現する行列をデータとして得ることができる。 本研究の目的は、このような所与の複数データの構造、特に因子、上記の例では、顧客と商品それぞれの因子を抽出するための、一般性のある行列分解の枠組みと効率的な解決手法を構築することである。特に、以下の2つの最も典型的な複数データが与えられる入力設定を対象とする。 設定1)入力データは3つの行列であり、メインデータの行列に対して、行と列それぞれに行および列を共有する行列(特徴行列と呼ぶ)が与えられる。 設定2)入力データは4つの行列であり、メインデータの行列に対し、行と列それぞれに行及び列を共有する行列が与えられるのみならず、この2つの特徴行列の行と列そそれぞれ共有する特徴行列が4番目の行列として与えられる。 いずれの設定においても、目的は、入力複数行列から、メインデータの行と列を構成する因子を抽出し、データに内在する構造を明らかにすることである。平成29年度は、まず、28年度に構築した手法を実験結果に基づき改良するとともに論文にまとめた。また、学習(最適化)手法の改良に取り組んだ。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の年度計画通りに推移しているため。
|
今後の研究の推進方策 |
今後は、手法構築・改良を継続するとともに、実データへの適用を進め、生命情報科学等の実応用において成果を出すことを目標とする。
|