研究課題/領域番号 |
22K15258
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分47010:薬系化学および創薬科学関連
|
研究機関 | 国立研究開発法人理化学研究所 (2023) 慶應義塾大学 (2022) |
研究代表者 |
清水 祐吾 国立研究開発法人理化学研究所, 計算科学研究センター, 研究員 (00809006)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 合成中分子 / 機械学習 / 深層学習 / タンパク質間相互作用標的 / データベース / AI創薬 / PPI阻害 / 分子ドッキング / データ均衡化 / 阻害活性評価 / 計算科学 |
研究開始時の研究の概要 |
中分子化合物を用いたタンパク質間相互作用(PPI)阻害化合物の探索が期待されている。本研究は経口投与可能かつ生体内安定性の高い、分子量500~1,000程度の合成中分子を対象とし、人工知能(AI)技術を利用した効率的なPPI阻害剤探索手法の開発を目的とする。このための手法を、最新のAI技術の開発とタンパク質・化合物構造情報や構造ベース創薬(SBDD)手法の活用により構築する。また、PPI阻害実験による検証を行うことで妥当性を評価し、多種多様なPPI標的の創薬研究促進の基盤技術とすることを目指す。
|
研究実績の概要 |
2023年度は主に(1)学習データの少なさによる精度低下の改善手法、(2)活性向上のための予測手法、(3)予測根拠の可視化手法の3点について開発・検討を行った。 (1)昨年度公共データベースDLiP・ChEMBLから構築した中分子化合物・活性情報データベースに対し、分子記述子を特徴量に用いたディープニューラルネットワークや分子構造をグラフとして扱うグラフニューラルネットワーク等の深層学習を用いた活性予測モデル(活性あり・なしの分類モデル)の構築を行った。これらのモデルについて、学習データの少なさによる精度低下を解決するため、2つの方法を検討した。1つは複数の標的の学習を同時に行う手法(マルチタスク学習)、もう1つは豊富に存在する活性未知の化合物データを利用した手法(半教師あり学習)であり、これらが有効となる条件の解析を行った。 (2) 1つの閾値での分類モデルによる活性予測では活性の強さが予測に反映されにくいという問題があるため、回帰モデル(=活性値そのものを学習)や活性の強さ別分類モデルによる予測手法を構築し、その精度を検証した。タンパク質結晶構造情報が利用できる標的に対しては、分子ドッキングによる構造ベース創薬(SBDD)手法の併用も検討した。 (3)新規阻害化合物を化合物ライブラリー等から探索するにあたり、活性予測した化合物群から実験に用いる化合物を選択する際、化合物の各分子記述子・構造が活性予測へどのように寄与しているかを定量・可視化し、確認することが重要であると考えられる。そこでSHAP値及びIntegrated gradientsによる予測根拠の定量・可視化を実装し、確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
昨年度の進捗遅延及び研究機関の変更による環境変化に伴い引き続き進捗状況はやや遅れている状況である。
|
今後の研究の推進方策 |
今後はまず、PPI阻害の活性強度予測に寄与する3次元記述子やPPI特徴記述子の調査及び開発を行う。次に、仮想化合物ライブラリーの利用による化合物空間の拡張を行う。この際、医薬品特性(PAINSフィルター等)、活性向上、新規性、合成可能性等を加味した上で有望な化合物を選択する方法を開発する。また、反復スクリーニングによる実験的検証を行う際の効率的な化合物選択手法の検討も行う予定である。
|