研究領域 | 化学コミュニケーションのフロンティア |
研究課題/領域番号 |
17H06410
|
研究機関 | 慶應義塾大学 |
研究代表者 |
榊原 康文 慶應義塾大学, 理工学部(矢上), 教授 (10287427)
|
研究分担者 |
佐藤 健吾 慶應義塾大学, 理工学部(矢上), 講師 (20365472)
齋藤 裕 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (60721496)
|
研究期間 (年度) |
2017-06-30 – 2022-03-31
|
キーワード | 人工知能 / 深層学習 / ケミカルスペース / マルチオミックス |
研究実績の概要 |
1. 化合物タンパク質相互作用を予測する深層学習手法に,タンパク質タンパク質相互作用および化合物ネットワークのオミックスデータを導入することで,マルチオミックス統合モデルを構築し,既存の手法を予測精度で上回ることができた. 2. 機械学習による新規PKCリガンドの探索.A02入江グループの所有するPKCリガンドを教師データとして畳み込みニューラルネットワークによる深層学習モデルを構築し,PubChemの約1億種類の化合物に対してスパコンによる網羅的な結合予測を行った.新規骨格を有するリガンド候補を多数発見することに成功した.現在,A02入江グループによる活性評価と構造単純化アナログの開発が進行中である. 3. 深層学習手法であるDeep Auto Encoder(自己符号化器)にPCA解析(主成分分析)を組み合わせることにより,化合物構造の多様性を可視化する手法を開発した.本手法を用いて,掛谷(A01),上杉(A02),井貫(A02)が保有する化合物の多様性を,Drug Bank DB(認可薬データベース)の化合物をベースとして比較し,可視化した. 4. 強化学習を用いてバーチャルに化合物構造を生成する手法の開発.深層強化学習手法に,SMILES文法規則を表す特徴行列を用いた化合物構造の生成モデルを組み込み,分子特性の最大化,学習モデルの最適化を行い,先行研究と比較を行った.3つの分子特性指標(薬らしさ,疎水性,分子量)に関して最適化評価を行った結果,本手法は全てにおいて先行研究に匹敵するかそれ以上の最適化能力を示した. 5. 昨年度開発したmxfoldを拡張し,自由エネルギー最小化に基づく手法と深層学習に基づく手法を組み合わせ,さらに自由エネルギー値に基づく正則化を深層学習モデルに組み込むことによって適切な複雑さを表現することができる二次構造予測モデルを学習した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画調書に記載した中間目標である網羅的にタンパク質化合物結合予測を高精度に行うバーチャルスクリーニングシステムである次世代COPICAT第一バージョン開発がほぼ目前のところまできており,順調に進展している. 新規PKCリガンドの探索について,入江グループによる構造単純化アナログの合成が進行中である.これらの結合活性データを予測システムにフィードバックすることにより,さらなるPKCリガンドの発見が期待できる.
|
今後の研究の推進方策 |
マルチオミックスデータを組み合わせたタンパク質-化合物相互作用予測手法の精度をさらに向上させることにより次世代COPICATの完成を目指す.深層学習手法であるDeep Auto Encoder(自己符号化器)にPCA解析(主成分分析)を組み合わせる化学コミュニケーション空間の解析手法について,化合物構造の多様性を可視化する手法の開発を続ける.掛谷班,上杉班,井貫班をはじめとする領域各班が保有する化合物を収集し,ケミカルスペースへのマッピングを行い,多様性の評価や新規化合物の生成を行うことで,AIプラットフォームの構築を行っていく. また,深層強化学習による配列生成アルゴリズムを実装し,特定タンパク質をターゲットとする核酸創薬を目指した配列設計の計算機実験を行う.
|