2012 Fiscal Year Annual Research Report
グラフ構造データの予測的分析のための機械学習手法の研究
Project/Area Number |
22680012
|
Research Institution | The University of Tokyo |
Principal Investigator |
鹿島 久嗣 東京大学, 情報理工学(系)研究科, 准教授 (80545583)
|
Project Period (FY) |
2010-04-01 – 2014-03-31
|
Keywords | 機械学習 / データマイニング / グラフ / ネットワーク |
Research Abstract |
グラフ構造は化合物やソーシャルネットワークなど、創薬やウェブサービスなど様々な場面で現れてくる極めて重要度の高いデータ形式であるが、これまでのデータ解析手法では十分に対応しきれていない面がある。本研究課題では、特に予測モデル化という観点から、グラフ構造を内外にもつデータを扱うための統一的な機械学習アプローチを行っている。24年度も前年度までから引き続き機械学習手法の開発を中心に研究を行ってきたが、3つの主要な研究成果があった。 ひとつめは、巨大グラフ、たとえばソーシャルネットワークなどの上での分類予測問題についてのものである。2003年に代表研究者が世界で初めて提案して以降、自身を含む世界の様々な研究者が発展させてきたグラフカーネル法を、さらに高速化させることで巨大グラフ上での予測を実現した。もうひとつはグラフの部分クラスである木構造をもったデータに対する極めて効率的な学習手法についてのものである。これは近年著しく発展している離散的データ構造を、機械学習アルゴリズムと密接に融合することで新たな研究の局面を切り開いた重要な結果である。3つめはこれまでとは異なる行列分解を用いたモデル化によるグラフ構造データ解析の手法についてのものである。これはこれまでにない新しい問題設定を提案しており、今後の発展が注目される。 以上の研究成果はすべて一流の国際会議において受理され、学会において高い評価を得ている。特に、行列分解についての研究成果は国際会議PAKDDにおいて、Best Student Paper Runner Up (学生論文賞・次点)に選出された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
グラフカーネルを用いたグラフ上のノード予測問題の解決により、当初目標としていたグラフ内外の統一的予測は(リンクの予測問題においてはまだ課題を残すものの)ある程度解決した。また、先進的離散データ構造を用いた学習法については当初予想をしていなかった著しい展開を見せており、非常に期待ができるものと考える。また、新しい行列分解手法についても当初想定していなかった新しい問題提起となっており、今後も引き続き検討が望まれる。
|
Strategy for Future Research Activity |
課題であるリンク予測(ネットワークの構造予測)問題への発展を進めるとともに、実応用領域への適用を目指す。 また、先進的離散データ構造を用いた学習法については、簡潔データ構造と呼ばれる新しいデータ構造と機械学習アルゴリズムのより密接な融合を中心に集中的に研究をすすめ、新たな重要研究テーマの早期確立を目指す。 新しい行列分解問題についても、その一般化や適用可能性の検討などを進める。
|