本計画の大きな二つの課題であった(1)データ点群の部分集合が成す凸包構造の族を用いたパターン識別、(2)データ点そのものの部分的類似構造への分解をもとにした知識発見法のうち、(1)については前年度に一定の成果を得たため、本年度は(2)について研究を行った。(2)についても前年度、事例研究として糖鎖データ(木構造データ)のマイニングを研究したが、同様な生物化学データとして薬剤等の低分子化合物とその標的タンパク質の相互作用データの解析を主に行った。化合物-タンパク質問相互作用データは従来思われていたように1化合物-1標的の関係ではなく多対多の複雑な相互作用を示すことが近年示唆されている。特に現行の有効承認薬剤の多標的性が明らかになるにつれてpolypharmacologyの重要性が再認識されているが未だこの相互作用データについては化合物-標的ネットワークのトポロジー分析が主な分析技術であった。本年度はこの相互作用データの解析に取り組み、本計画で掲げている部分構造類似性からのアプローチとして、作用する化合物とタンパク質のペアについて、化合物は分子グラフ、タンパク質はアミノ酸配列とみなし、どのような部分構造ペア(部分グラフ-部分配列ペア)が有意に頻出しているかを厳密かつ効率的に調べる方法論を確立し現行のデータの大規模な分析を行った。結果として現行の化合物-標的ネットワークは特徴的な部分構造ペアによっていくうかのpolypharmacologyパターンとして捉えられることが示され、GPCRなどにおける立体構造との比較の観点からの機能モチーフ候補も発見された。これらの成果をまとめ現在論文として投稿中である。本年度はこの他、この分析に用いた統計的交互作用検定の応用的派生としてSNPが遺伝子発現のepistaticな相互作用に与える影響について分析する方法論の共同研究にも取り組み化一定の成果を得た。
|