研究期間の1年目でグラフ列挙アルゴリズム,2年目で列挙された化合物を蓄積・管理するグラフデータベースを作成した,様々なラベル付きグラフを列挙することは,様々な種類の原子が化学結合によって結合するグラフを列挙することに相当する.これにより.当初の目的である有機化合物の新規骨格創製が可能であると考えている. これまでに作成した手法の活用法を,本年度の初期に検討した結果,人工的に作成した化合物のデータは,深層学習法における事前学習法に活用できる可能性がある.そこで,化合物のデータを深層学習法に適用するために,各化合物をシンボルの集合に変換する方法を検討した.具体的には,化合物グラフの各頂点を,その頂点ラベルに応じて,ベクトルで表す.このとき,あるグラフはベクトル(シンボル)の集合で表すことができる.このベクトルの集合では,グラフの構造情報が失われているので,ある頂点vのベクトルとvに隣接する頂点のベクトルの和を,新たにvに対するベクトルとする.これにより,vの周辺構造をあるベクトルで表すことができる.上記を繰り返すことで,あるグラフをベクトルの集合で表すことができる.この表現形式の妥当性を評価するために,この表現形式に基づくグラフカーネルを定義し,化合物の変異原性の予測などの評価実験を行った.実験結果によると従来のグラフカーネルよりも予測精度が10%も向上する場合があり,提案した表現形式の妥当性を示せた.
|