2010 Fiscal Year Annual Research Report
In-silico創薬のための機械学習を用いた生理活性配座予測
Project/Area Number |
21680025
|
Research Institution | National Institute of Advanced Industrial Science and Technology |
Principal Investigator |
津田 宏治 独立行政法人産業技術総合研究所, 生命情報工学研究センター, 主任研究員 (90357517)
|
Keywords | 機械学習 / 生体分子 / 生理活性 |
Research Abstract |
平成22年度は、数百万を超えるタンパク質のリガンド結合サイトから、類似したペアを網羅的に探索するシステムを、従来より開発してきたSketchSortアルゴリズムを用いて実装した。それをPDBに含まれる全タンパク質の全ポケットに適用したところ、8000万を超える結合サイトのペアを発見した。詳しい解析の結果、機能未知のポケットの中に、他のサイトとの類似性によって、新規機能が強く示唆されるケースも発見することができた。この成果は、論文にまとめ、Proteins誌に投稿した。現在、改訂中である。 これと並行して、多数のリガンド間の高速な全ペア類似度検索を可能にするため、化学化合物の性質を表すフィンガープリントと呼ばれる特徴ベクトル向けのSketchSortアルゴリズムを開発した。PubChemデータを用いた実験において、従来のフィンガプリント検索手法と比較すると遥かに高速であることが確認された。この成果は、現在MolecularInformatics誌に投稿中である。さらに、リガンド用のSketchSortを、創薬統合環境MOE上で動作させるため、SVL言語に移植中である。これが完成すれば、一般に公開し、多くの研究者に提供する予定である。 高速全ペア検索のアイデアは、タンパク質関連のみならず、DNA配列にも適用することができる。本年度は、次世代シークエンサの配列データの中なら編集距離の意味で類似したものを高速に発見できるSlideSortというアルゴリズムも開発し、Bioinformatics誌に発表した。これにより、従来は非常に難しかった大量配列の階層的クラスタリングが可能になった。
|