タンパク質の立体構造と機能との間には密接な関係があることは良く知られている事実である。本年度研究では、主として有機低分子を対象として、トポロジカルフラグメントスペクトル(TFS)法を参考に、分子の立体構造を記述する新たな方法を提案した。ここでは、三次元幾何情報を含めた化合物分子の構造を、その構成原子をノードとし、それらの間の幾何学的関係の情報をエッジ上に重み付けた、エッジ重み付き完全グラフとして表現する。次に、(1)与えられた三次元構造式に対応する上記のグラフから可能なすべての部分グラフ(フラグメント)を列挙する。(2)それぞれのフラグメントfに対し、フラグメント特徴量W(f)を計算する。(3)同じW(f)を持つフラグメントを数え上げ、ヒストグラムを作る。このヒストグラムを、ジオメトリカルフラグメントスペクトル(GFS)と定義した。フラグメント特徴量としては、そのフラグメントの三次元構造を反映した値、例えばフラグメントを構成する全ての原子間距離の総和を用いる。分子のサイズ(構成原子数)が大きくなると、そのフラグメントの列挙には組み合わせ論的な問題が発生する。そのため、本研究では列挙するフラグメントのサイズの範囲をユーザが指定できるように工夫した。 ある一つの分子構造から生成したGFSは、TFSと同様に、多次元ベクトル空間上のひとつの点とみなすことができる。従って、ある二つの分子構造の類似度は、それに対応する多次元ベクトル空間上での二点間の距離で定義することができる。当研究室で作成した匂い-構造式データベースを用いて構造類似性検索実験を試みたところ、クエリ構造とはトポロジカルな構造特徴は異なるものの、同じ匂い活性を持つ構造を類似度上位に見出すことができた。
|