研究課題/領域番号 |
23K21721
|
補助金の研究課題番号 |
21H03547 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 長浜バイオ大学 |
研究代表者 |
白井 剛 長浜バイオ大学, バイオサイエンス学部, 教授 (00262890)
|
研究期間 (年度) |
2021-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
15,340千円 (直接経費: 11,800千円、間接経費: 3,540千円)
2025年度: 3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2024年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2023年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2022年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2021年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
|
キーワード | 生命分子計算 / 生体超分子構造 / データサイエンス医療 / グラフ理論 |
研究開始時の研究の概要 |
疾患とその治療薬の関係は分子構造・分子間相互作用データにより一般的に定義可能か?この問に既存の疾患原因となる遺伝子・タンパク質、既存の治療薬、およびそれらの分子相互作用グラフデータの高次元化により答え、新規の疾患に対する新規の治療薬ターゲットを発見するアルゴリズムを定義する。
|
研究実績の概要 |
2022年度計画に従い、疾患-治療薬経路グラフデータ高次化のために、主として医薬品(ドラッグ)立体構造モデルの構築および立体構造データの疾患-治療薬経路グラフへの連結するための高次化研究を実施し、高分子薬(抗体・核酸など約500分子)を除く約21,000の構造モデルを構築した。高分子薬については、翻訳後修飾(糖鎖修飾)・人為的修飾(リンカーによる医薬品の添加やPEG化)など手動モデリングの過程を要するので、alphafold2などを活用しながら構築をすすめ、主に核酸医薬品など全体の30%程度のモデルを構築した。現在は主として抗体医薬品のモデル構築を進めている。 また疾患-治療薬パスの勾配ブースト決定木(GBDT)による予測精度の検証のため、ヒト疾患一般に対して平均して高いスコアを示すドラッグターゲット(ヒトタンパク質)を予測し、文献調査などから近年新規に提唱されたターゲットが含まれるか検討を行い、新規ターゲットが有意に高スコアを示すことを見出した。これはすべてのヒトタンパク質を起点(仮定ターゲット)としてすべてのヒト疾患に対する有効性を数値化し、全体(19412タンパク質分子)の分布を、近年(2017年以降)新規のターゲットとして論文等で提唱されたタンパク質(ANGPTL3, TSLP, IL17F, FCGRTなど46分子)の分布と比較したもので、DTXによりターゲット候補の得点(平均0.28, 分散0.05)はt検定でP<0.0001で全体(平均0.12, 分散0.07)と異なる分布を示した。この結果によりDTXによる予測の有効性が裏づけられた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2022年度実績の概要に述べた様に、概ね計画に沿って進行していると判断した。当初計画からの変更としては、抗体医薬品を含む高中分子の情報500件のDTXへの追加登録とモデリングがあったが、これらはデータの補強に大きく寄与することから、重大な障害にはならないと判断した。
|
今後の研究の推進方策 |
今年度は引き続き、高分子薬の構造モデルの構築とターゲットタンパク質との複合体構造データの作成を行い、疾患-治療薬経路グラフへの連結を推進する。高分子薬の構造モデルは低分子薬と比較してモデル構築の自動化が困難であるので、今後のデータベース更新も考慮して、モデリングのためのパイプラインの構築を行う。これはMODELLERなどホモロジーモデリング法とalphafold2などの機械学習法と、修飾アミノ酸など悲タンパク質部分構造の構築を組み合わせて構築する。また、ターゲットタンパク質複合体構造を利用して、ドメインなどの分割を考慮した疾患-治療薬経路グラフと機械学習の高度化をおこなう。これはSIRD(https://sird.nagahama-i-bio.ac.jp/sird/)など独自開発した構造分類データベースを利用して行う。疾患-治療薬経路グラフ上で現在1ノードとして表現されているタンパク質(例えばPRO1)を、ドメイン毎にPRO1-D1, PRO1-D2などのノードに分割し、相互作用などのエッジを特異的に結合するドメイン(ノード)に連結することで、グラフの高精度化を行う。さらに、この高度化により予測精度が向上するか検証する。
|