創薬における定量的構造活性相関など、対象データがグラフ表現で与えられる場合の教師付き学習において、データの出自、計測対象の多因子性などの影響により、実データは「不均質さ」を伴う。この問題に対処するため主に4点の研究を行った。1:可能な部分グラフ特徴の有無をすべて考え、その中から予測モデルの学習と必要な特徴の学習を同時に行う手法の開発と分析を行った。2:部分グラフ特徴の空間を0/1値、相関構造、冗長性等の観点から分析した。3:全ての部分グラフ特徴を対象に決定木・回帰木を学習する手法の構築とアンサンブル学習拡張を行った。4:部分グラフ特徴にワイルドカードを許容する場合の手法構築と分析を行った。
|