研究概要 |
本年度は,(1)3次元グラフ構造データマイニングに必須な原理の確立,及び(2)分野特有のデータ特性や処理に適した手法への拡張や技術統合の2つに取り組んだ. (1)については,これまでの3次元グラフ構造データマイニングの予備的研究により必要であることが分かっている基礎原理の確立に取り組んだ.具体的には,(i)2次元グラフで用いた隣接行列表現を拡張し,多数の3次元グラフ構造データを計算機上で効率的に取り扱うための表現方法の確立,(ii)従来のグラフトポロジーのみに着目したマイニングをに対し,グラフの3次元座標や距離など数値情報を厳密に扱って探索を行うための原理の開発,(iii)3次元グラフとしての本質的な構造の不変性と位置や距離の差異を考慮したグラフ部分同型性判定を行う方法の開発,(iv)膨大な3次元グラフ構造データから頻出構造部位を実用的時間で高速計算マイニングする完全探索アルゴリズムの開発,(v)発がん性など特徴を有する3次元グラフ構造,及びその特徴を持たない3次元グラフ構造のそれぞれに頻出する部分的部位構造を上記アルゴリズムで探索し,更に両者を比較し,特徴の有無を決定づける部位を発見するアルゴリズムの開発を行い,次年度以降の研究遂行の基礎を確立した. (2)については,分野特有のデータ特性や処理への適応や技術統合を行い,3次元化学分子構造の問題領域のデータが有する特性や必要とされる処理に関する技術開発を行った.特に化学及び医療分野の研究者の協力を得て,人体に対する化学物質の影響を決定づける分子構造部位の同定を行うシステムを開発することを意図した手法適応化研究を行った.具体的には,(i)一般の3次元グラフ構造よりも化学化合物分子構造グラフデータの持つ構造が限られ出部位構造の探索空間が小さいこと,分子の立体構造形状のために生理活性に重要な働きをする部位は非連結3次元グラフ構造を持つ場合もあり得ることを考慮した,頻出部位構造完全探索の手法適応化,(ii)ベンゼン環やニトロ基などいわゆる原子団単位或いはそれらの立体的配位を考慮した組み合わせ単位での頻出部分構造のマイニングを行うための手法適応化,(iii)共有結合などで陽には示されない水素結合やファンデルワールス力結合などの潜在的結合存在の可能性を3次元情報に基づいて探索し,それらを考慮した頻出部位構造をマイニングするためも手法適応化を行い,3次元グラフ構造データマイニングを化学分子構造生理活性相関解析に即した技術に拡張する見通しを得た.
|