2016 Fiscal Year Annual Research Report
Supervised learning for inhomogeneous set of graphs
Project/Area Number |
26330242
|
Research Institution | Hokkaido University |
Principal Investigator |
瀧川 一学 北海道大学, 情報科学研究科, 准教授 (10374597)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 機械学習 / グラフ / 特徴表現 / 潜在構造 |
Outline of Annual Research Achievements |
化学構造式データなど、グラフ構造として保持されているデータが近年増大しており、これらのデータに対する機械学習技術の重要性や関心が高まっている。本研究課題では、創薬における低分子化合物の毒性や薬物動態のADME(吸収・分布・代謝・排泄)など、機序が複雑で化学的な定義付けが困難な生物活性の予測への応用を念頭に、機械学習に基づいて統計的にグラフデータの特徴付けを与える技術開発を目指している。特にこうしたデータは出自や計測環境の異なるデータの混在に由来する「不均質さ」を伴うため、この問題に対処する技術の検討や問題の分析を行っている。
本年度は、グラフデータを特徴付けする際の説明変数として部分構造特徴(部分グラフ)の有無を用いる一般的問題設定において次の研究に取り組んだ。(1) データ中に生起するすべての部分構造特徴から有効な少数の特徴だけを予測モデルを学習しながら同時に探索・学習を行う枠組みの基礎として、スパース性に対する制約付きで一般のロス関数を最小化する線形モデル学習の論文が受理・出版された。(2) 実際に創薬の現場の統計的バーチャルスクリーニングでよく用いられるECFP法(Extended Connectivity Fingerprint法)に関して、複数の不均質な実データに関して解析と精度評価を行い、グラフ学習法と比較を行った。(3) 与えられた予測問題を解く際に必要な特徴間の相関についてすべての部分構造特徴を考慮した上での決定木学習およびそのアンサンブル予測の実現・および不均質な実データに対する適用・解析を行った。
|
Research Products
(10 results)