2012 Fiscal Year Annual Research Report
大量のタンパク質リガンドデータより相互作用の構造的特徴をマイニングする方法の開発
Project/Area Number |
23700338
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
西郷 浩人 九州工業大学, 情報工学研究院, 准教授 (90586124)
|
Keywords | 国際情報交換(フランス、スイス) / バーチャルスクリーニング / ケモインフォマティクス / クラスタリング |
Research Abstract |
本研究が行うのはタンパク質リガンド相互作用の解明において鍵となる、結合中の化合物の部分構造とタンパク質のドメインの対を探索する方法の開発であり、以下の特徴をもつ。1)大量のタンパク質と大量のリガンドを同時に解析できる。2)タンパク質の立体構造が得られない場合にも利用出来る。3)既存のモチーフや商用の記述子のライブラリーを必要とせず、構造データのマイニング法により新規の相互作用モチーフを発見できる。 主要な統計的学習法として正準相関解析及び偏最小二乗回帰を用いてタンパク質とリガンドの間の相互作用予測を行うが、リガンドをグラフとして、その巨大な部分グラフ空間をデータ(グラフ)マイニングするのが特徴である。タンパク質情報としてはPFAMのモチーフやJAPICの副作用情報を用いる。これらの情報はしばしば数千以上に昇り、高価なグラフマイニングの呼び出し回数も比例して増えてしまいがちだが、Lanczos法の利用によりグラフマイニングの呼び出し回数を抑えることができる。これらは本研究の独自性を特徴づける点となっている。当研究は国際情報交換を伴うものであり、フランスの統計の専門家とはアルゴリズムを実際に試すデータの提供を受け、現実に起こる問題について議論を交わした。またスイスの研究所を訪問し、化学や計算機化学の専門家の方々より、運用面で実際に役に立つ方法について議論し、ベンチマークデータを提供して頂いた。
|