本研究は化学構造全体からみた漠然とした分子の“類似性"あるいは“多様性"を定量的に評価するための方法を考案するとともに、そのシステム化を目指すものである。構造特徴の記述には、筆者らが提案した化学構造式のグラフ表現にもとづく部分グラフの数え上げとその特徴づけをもとに生成されるスペクトル(構造フラグメントスペクトル、TFS)表現を利用した。前年度(平成9年度)研究では先に報告した部分グラフの完全列挙にもとづく全スペクトルの利用に対し、生成する部分グラフのサイズを制限した低次のフラグメントのみに注目したスペクトル(前者に対する指紋領域の部分スペクトルに相当)の有用性を明らかにした。 平成10年度研究では、特に類似性評価のための評価関数に注目し、約3600件の薬物構造データベースを利用した構造類似性検索を通じて、ユークリッド距離、平均ユークリッド距離、コサイン係数、Tanimoto係数(2値変数)、Tanimoto係数(連続変数)、ピアソンの積率相関係数の6種の異なる類似度(相違度)関数についてその適否等を比較・検討した。その結果、Tanimoto係数(2値変数)を除く5つの類似度関数については、その評価結果に比較的高い相関が見られることを明らかにした。また、これらの結果を踏まえ、化学構造式の作画入力、部分グラフの列挙と特徴づけ、フラグメントスペクトルの生成・表示、といった一連のプロセスの統合化を図り、構造類似性(多様性)評価のためのプロトタイプシステムの開発を行った。
|