2021 Fiscal Year Annual Research Report
Efficient estimation of data structure from multiple tensors
Project/Area Number |
19H04169
|
Research Institution | Kyoto University |
Principal Investigator |
馬見塚 拓 京都大学, 化学研究所, 教授 (00346107)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 機械学習 / バイオインフォマティクス |
Outline of Annual Research Achievements |
研究目的は、以下であった。すなわち、まず、現代社会のデータに急増している以下2つの点の組み合わせに着目した:1) テンソル(従来の行列のみならず高次元のテンソルが得られる)、2)複数データ(購買データのみならずSNS 等からユーザ間のリンク(隣接行列:「ユーザ×ユーザ」) 等が補助情報として得られ、モード(例えばユーザ) を共有する複数データ(行列) が得られる)。以上の2つの特徴を踏まえ、「モードを共有する複数テンソルの内在構造の効率的解析手法」構築を研究の目的とした。研究実施計画では、複数テンソルを表現(近似)可能な低ランクパラメータによるノルムを設計し、ノルムの効率的学習手法の構築及び学習誤差の解析から問題の包括・普遍的理解を目指した。一方、今年度の研究実績においては、より現実的なデータへの適用を考慮し、一般的なテンソルではなく制限のあるテンソルに関して、具体的な学習アルゴリズムを提案した。例えば、グラフの観点から、グラフのエッジ(ハイパーエッジ)が最大N個のノードを持つハイパーグラフは、N次元のテンソルとみなすことができる。従って、N次元のテンソル、すなわち、ハイパーエッジのノード数を最大Nとしたハイパーグラフの学習手法をハイパーグラフニューラルの枠組みで構築した。特に、N=3とした場合に、実データに対する適用から構築手法の性能が、特定の応用対象、すなわちバイオインフォマティクスでの非常に重要な問題である、複数薬物の副作用予測問題に対して、既存手法をはるかに凌駕する性能を挙げることが確認できた。これらの成果は、いくつかの論文としてまとめられ、特に、バイオインフォオマティクスのトップ国際会議であるISMB等に採択され、成果が世界のトップレヴェルにあることが実証できた。
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|