令和2年度はドラッグターゲット遺伝子-疾患-ドラッグパスのグラフパターンの解析を中心に、超分子グラフシステムの解析を継続した。これまで超分子グラフシステムにはタンパク質ノードとしてヒトタンパク質のみを収録していたが、今般の新型コロナウイルスパンデミックを考慮して、病原性細菌・ウイルスなどのタンパク質およびそれらの相互作用を大量にグラフに追加した。増補したグラフに基づいて、ターゲット遺伝子-疾患-ドラッググラフの機械学習(勾配ブースティング決定木、GBDT)によるドラッグ有効性の推定をおこなった。ここでは、疾患ノードと治療薬ノードを最短でつなぐ経路(パス)を、仲介する分子をコード化したベクトルとして表現し学習データとした。結果として、ある疾患とその疾患に有効なドラッグ間のパスと、その疾患の有効性が知られていないドラッグのパスで学習し交差検定した結果、精度0.90で有効ドラッグを識別することが可能であった。またドラッグリポジショニングの成功例と失敗例は精度0.90で、副作用報告の多いドラッグと少ないドラッグは精度0.79で識別可能であった。この結果から、ターゲット遺伝子-疾患-ドラッググラフが効率的なターゲット探索に利用可能であると期待される。ただし興味深い点として、上記の学習機でクロス予測(有効ターゲット-ドラッグで学習しドラッグリポジショニングの成功例を予測)では精度が著しく低下した。これは、これらの薬効のメカニズムが大きく異なることを示唆するので、今後精査が必要である。
|