Taming "untamed" generative AIs by developing compound optimization support tools that enable the interactive use of domain knowledge in medicinal chemistry
Project/Area Number |
22K12258
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
山本 一樹 東京大学, アイソトープ総合センター, 特任助教 (90758301)
|
Co-Investigator(Kenkyū-buntansha) |
大上 雅史 東京工業大学, 情報理工学院, 准教授 (50743209)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | ドラッグデザイン / 創薬知 / 化学構造生成モデル / 大規模言語モデル / ヒューマンコンピュテーション / オープンサイエンス / ケムインフォマティクス / 化合物空間 / 創薬計算科学 / 創薬計算化学 |
Outline of Research at the Start |
IT創薬・AI創薬と総称される計算技術開発の隆盛の中、計算で生成された化合物と現実に薬剤として有望な化合物との間には未だに乖離がある。現状の化合物生成モデルは新規性の高い化学構造を生成しようとすると化学・薬学的に不適切な化合物を多く生み出してしまう。そのような「野放図な」AIを真に実用的な手法へと昇華するには、創薬科学者のドメイン知識の統合が必須であると考え、本研究ではAIとドメイン知識の相互活用を促進し野放図なAIを人手で使いこなすためのツール群を整備し、AIとドラッグデザインの橋渡し基盤を実装する。またそれを実際の創薬標的に対して適用し、人-AI協奏による化合物最適化のPoC取得を目指す。
|
Outline of Annual Research Achievements |
本研究の主旨は、属人的な創薬知と AI との協奏を促すシステム基盤の構築と実証である。創薬関連のドメイン知識を有する者がその知識を以って化合物を選別する作業を効率化するツールの実装をこれまで進めて来たが、一方、ドメイン知識は自然言語的に表現されるケースも多々あり、自然言語で記載されたような知識データは機械的には取り扱い困難な面があった。従来、自然言語で記述された知識を計算モデルに取り込み可能なルールベースの記法に変換するには人手の介在も必要となる場合が多かったが、ちょうど 2022 年度末頃から大規模言語モデル (LLM) 分野でのブレークスルーがもたらされ、自然言語のままのドメイン知識データを機械的に取り扱う手法の実現性が出てきた。とはいえ 2023 年度初頭時点で LLM が創薬科学分野のタスクをどの程度こなせるかは未知数であったため、まずはフィージビリティスタディとして LLM を創薬科学計算にどう役立てることができるかを探った。コンテスト形式で参加者を募り、実際の創薬標的に対して LLM を活用して活性化合物候補を提案するタスクを課した。結果としては、開催時点での LLM は物理化学現象そのものを定量的演算を以って取り扱うことはほぼできないが、計算タスクの自動化をアシストさせるには有用であるといった知見がコンセンサスとして得られた (国際会議 NeurIPS 2023 AI4Mat Workshop に開催報告を投稿し採択となり、発表を行った)。また、提案化合物群を複数のメディシナルケミスト陣に採点してもらう作業の過程で、前年度までに開発したウェブツール https://sanitizer.chemical.space/ に機能追加を行い、創薬化学的観点に基づく化合物評価をデータ収集できるシステム wisdom.chemical.space として拡張し、公開した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究における開発要件である人-AI協奏創薬計算科学プラットフォームの構築のため、本年度は前年度までに実装した、構造式の効率的な選別のためのウェブアプリケーション sanitizer.chemical.space を機能拡張した wisdom.chemical.space の実装・提供ができた。メディシナルケミストに試用を依頼し、使用感のフィードバックも受けながら継続的改善を図っている。また、今まさに勃興しつつある大規模言語モデル分野の創薬科学応用についても検討に着手することができた。今回実際に創薬標的として採用したタンパク質 (Cbl-b) については、既知の阻害剤との複合体立体構造を結晶構造解析により新規に決定することに成功 (株式会社アグロデザイン・スタジオに外注) しており、今後、新規阻害剤を取得できた際にもスムーズに複合体立体構造を実測によって決定できる準備を整えることができた。
|
Strategy for Future Research Activity |
2023 年度に開発した wisdom.chemical.space システムを活用して実施した創薬チャレンジにおいて得られた候補化合物群の活性チェックをアッセイ実験にて行う。ヒット化合物が得られれば、複合体立体構造を結晶構造解析により取得(株式会社アグロデザイン・スタジオへの外注体制を構築済み)しつつ、Hit-to-Lead の過程に着手する予定である。加えて、化合物生成モデルをウェブ上でスムーズに駆使できるシステムを用意し、本プロジェクトの chemical.space ツール群との連携の実装を進める。
|
Report
(2 results)
Research Products
(16 results)