研究課題
2022年度計画に従い、疾患-治療薬経路グラフデータ高次化のために、主として医薬品(ドラッグ)立体構造モデルの構築および立体構造データの疾患-治療薬経路グラフへの連結するための高次化研究を実施し、高分子薬(抗体・核酸など約500分子)を除く約21,000の構造モデルを構築した。高分子薬については、翻訳後修飾(糖鎖修飾)・人為的修飾(リンカーによる医薬品の添加やPEG化)など手動モデリングの過程を要するので、alphafold2などを活用しながら構築をすすめ、主に核酸医薬品など全体の30%程度のモデルを構築した。現在は主として抗体医薬品のモデル構築を進めている。また疾患-治療薬パスの勾配ブースト決定木(GBDT)による予測精度の検証のため、ヒト疾患一般に対して平均して高いスコアを示すドラッグターゲット(ヒトタンパク質)を予測し、文献調査などから近年新規に提唱されたターゲットが含まれるか検討を行い、新規ターゲットが有意に高スコアを示すことを見出した。これはすべてのヒトタンパク質を起点(仮定ターゲット)としてすべてのヒト疾患に対する有効性を数値化し、全体(19412タンパク質分子)の分布を、近年(2017年以降)新規のターゲットとして論文等で提唱されたタンパク質(ANGPTL3, TSLP, IL17F, FCGRTなど46分子)の分布と比較したもので、DTXによりターゲット候補の得点(平均0.28, 分散0.05)はt検定でP<0.0001で全体(平均0.12, 分散0.07)と異なる分布を示した。この結果によりDTXによる予測の有効性が裏づけられた。
2: おおむね順調に進展している
2022年度実績の概要に述べた様に、概ね計画に沿って進行していると判断した。当初計画からの変更としては、抗体医薬品を含む高中分子の情報500件のDTXへの追加登録とモデリングがあったが、これらはデータの補強に大きく寄与することから、重大な障害にはならないと判断した。
今年度は引き続き、高分子薬の構造モデルの構築とターゲットタンパク質との複合体構造データの作成を行い、疾患-治療薬経路グラフへの連結を推進する。高分子薬の構造モデルは低分子薬と比較してモデル構築の自動化が困難であるので、今後のデータベース更新も考慮して、モデリングのためのパイプラインの構築を行う。これはMODELLERなどホモロジーモデリング法とalphafold2などの機械学習法と、修飾アミノ酸など悲タンパク質部分構造の構築を組み合わせて構築する。また、ターゲットタンパク質複合体構造を利用して、ドメインなどの分割を考慮した疾患-治療薬経路グラフと機械学習の高度化をおこなう。これはSIRD(https://sird.nagahama-i-bio.ac.jp/sird/)など独自開発した構造分類データベースを利用して行う。疾患-治療薬経路グラフ上で現在1ノードとして表現されているタンパク質(例えばPRO1)を、ドメイン毎にPRO1-D1, PRO1-D2などのノードに分割し、相互作用などのエッジを特異的に結合するドメイン(ノード)に連結することで、グラフの高精度化を行う。さらに、この高度化により予測精度が向上するか検証する。
すべて 2023 2022
すべて 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 5件) 学会発表 (4件) (うち招待講演 4件) 図書 (1件)
Hum Mol Genet.
巻: 32 ページ: 1683-1697
10.1093/hmg/ddad008
Biochem
巻: 61 ページ: 1543-1547
10.1021/acs.biochem.2c00166
Front Endocrinol
巻: 13 ページ: 1033074
10.3389/fendo.2022.1033074
Sci. Rep.
巻: 12 ページ: 12231
10.1038/s41598-022-16304-1
Experimental Cell Research
巻: 417 ページ: 113163
10.1016/j.yexcr.2022.113163