研究課題/領域番号 |
17J06897
|
研究機関 | 東京工業大学 |
研究代表者 |
柳澤 渓甫 東京工業大学, 情報理工学院, 特別研究員(DC2)
|
研究期間 (年度) |
2017-04-26 – 2019-03-31
|
キーワード | 創薬支援計算 / バーチャルスクリーニング / ドッキング計算 / 計算結果の再利用 / 高速化 |
研究実績の概要 |
1億件以上もの膨大な数の化合物から薬剤候補化合物を計算機で選別するバーチャルスクリーニングは、薬剤開発の初期段階における重要技術とされている。本研究は、従来手法では1億件の処理に数十年を要するタンパク質-化合物ドッキング計算について、化合物部分構造(フラグメント)の計算結果の再利用を行う手法を開発し、計算の加速に大きく貢献するGPU計算を用いることで従来の1000倍の計算速度向上を図るものである。平成29年度は、【1.化合物フィルタリング手法の改良】および【2.計算結果の再利用を行うドッキング手法の開発】を進めた。以下に研究成果を示す。 【1.化合物フィルタリング手法の改良】 これまでの研究成果となる化合物フィルタリング手法SpressoがBioinformatics誌に採択・掲載された。また、「局所的なフラグメント間の衝突考慮」「タンパク質-化合物相互作用情報 (Interaction Fingerprint) による機械学習」などを通した精度向上を試み、国際会議であるBPS18にてポスター発表を行った。 【2.計算結果の再利用を行うドッキング手法の開発】 ドッキング手法の開発に先立ち、フラグメントの計算結果の再利用を最適化するアルゴリズムを提案し、国際会議APBC2018に採択・口頭発表を行い、またComputational Biology and Chemistry誌に採択された。さらに、このアルゴリズムを利用したドッキング手法の開発を当研究室内で進めており、国際会議APBC2018にてポスター発表(Kubota et al., 2018)を行うなど、開発が進められている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
平成29年度の研究実施計画では、これまでの研究成果であった化合物フィルタリング手法Spressoの改良を行い、計算結果の再利用を行うドッキング手法の開発を予定していた。平成29年度は、査読付き国際論文2報が採択されるなど、極めて順調に進展した。 (1) フィルタリング手法の改良 Spressoは化合物の評価時にフラグメント間の衝突を考慮しないことで超高速な化合物のフィルタリングを実現したが、一方でタンパク質結合ポケットのサイズと比べて著しく大きな化合物を許容してしまうなど、精度上の問題があった。これに対して、「局所的なフラグメント間の衝突考慮」やドッキング計算の結果をタンパク質-化合物の相互作用を0/1のビット列で表す「Interaction fingerprintを用いた機械学習」などを通した精度向上を試み、国際会議であるBiophysical Society Annual meeting (BPS18)にてポスター発表を行った。 (2) ドッキング手法の開発 本研究における高速化の要点である「部分構造の再利用」は、ドッキング計算を行う上で多大なメモリを消費することがわかっている。すなわち有限のメモリ空間を有効利用することで高速化率を高めることが期待されるが、これを定式化し、最小費用流問題に帰着させた。最小費用流問題は多項式時間で最適解が導出できることが知られており、今回の問題に特化したアルゴリズムを提案し、国際会議APBC2018に採択・口頭発表を行い、Computational Biology and Chemistry誌に論文が採択された。また、前述のアルゴリズムを用いたドッキング手法の開発も並行して進めている。メモリ使用量の問題からGPU実装の部分に難しさがあるものの、国際会議APBC2018にてポスター発表を行うなど、順調に進んでいるといえる。
|
今後の研究の推進方策 |
当初の平成30年度の研究実施計画通り、東京工業大学のスーパーコンピュータであるTSUBAME3に向けた並列実装、合わせてフィルタリング手法Spressoと開発中であるドッキング手法を組み合わせた薬剤開発への応用を今年度の方策とする。 (1) スーパーコンピュータに向けた並列実装 これまで開発を進めてきたドッキング手法について、TSUBAME3上での利用を想定したノード内・ノード間並列実装、および平成29年度に引き続くGPU実装を行う。これまでのところドッキング計算が一通り行えるようになっており、また部分構造の再利用を行わない場合と比べても高速化が達成されていることが確認できているが、現状1ノード・1CPUコアのみを利用するプログラムとなっており、計算速度は十分とは言えない。OpenMPを用いたノード内並列実装、およびMPIを用いたノード間並列実装を行い、高速化を実現する。合わせて、メモリ使用量を考慮したGPU実装の方策を検討・実装することで、当初の目的であった「従来の1000倍の計算速度向上」を図る。 (2) 薬剤開発への応用 スーパーコンピュータに向けた実装と並行して、ドッキング手法の熱帯病(NTDs)薬剤の開発への応用を行う。応用先としてはウエストナイル熱ウイルスとの関連が示唆されているSrcファミリーに属するc-Yesタンパク質を想定している。c-Yesタンパク質はタンパク質の結晶構造が得られていないため、複数のタンパク質モデリング構造を作成し、それらすべてに対してドッキング計算することが精度の面で望ましいとされている。これは多大なる計算量を必要とするため、開発した高速なドッキング手法をTSUBAME3上で利用することで計算を完了させ、薬剤候補化合物の選別を行う。
|