研究課題/領域番号 |
20K16075
|
研究機関 | 滋賀大学 |
研究代表者 |
江崎 剛史 滋賀大学, データサイエンス教育研究センター, 准教授 (20717805)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 転移学習 / 吸収率 / インシリコ |
研究実績の概要 |
創薬には膨大な労力と費用が掛かっており、1つの医薬品研究開発にかかる年月は10-18年、費用は2500億円以上にのぼるとの報告がある。従来は、ある標的分子に作用する可能性がある化合物候補を合成し、薬物動態や安全性に関する試験を行い、薬としてのポテンシャルが低い(溶解性や膜透過性が低い、または毒性があるなど)と判断された化合物を除外していく。そして残った化合物は合成して構造を最適化し、再度試験を行う。この作業を繰りし、治験薬として創り上げていく。この従来法では、大量の化合物を準備することから始まり、多くの実験を行って薬を絞り込むため、膨大な労力と費用がかかる。 近年、創薬の効率化を図るための手法として、化合物の構造から薬としての性質を予測するin silicoモデルが注目されてきている。化学構造だけから薬の性質を予測できれば、化合物を合成する前に「薬としてのポテンシャル」を推定し、可能性がある化合物だけを合成し、実験できるため、合成や実験に必要な費用や労力を大きく削減できる。 創薬初期の段階で「薬としてのポテンシャル」を予測するためには、生物学的利用率(Bioavailability, BA)が有効な指標となる。BAは吸収と代謝が関係するパラメータであり、精度よく予測するためには、吸収や代謝に関する実験結果を組み込んで予測モデルを構築することが効果的である。そしてアカデミアを含む創薬の効率化に向け、このモデルを自由に使用可能にすることが重要である。そこで、①最大規模の精査されたデータを用い、②異なる性質の3種の記述子(物理化学的性質、Finger Print、Graph Convolution)を算出し、③転移学習によって関連性の高いin vitro試験の結果を深層学習に組み込み、現状のモデルを超える最高精度のヒトBA予測モデルを構築し、創薬研究者が広く使える環境を整備する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題では、複数のデータベース(ChEBML、ADMEDatabaseなど)から独自に精査して収集した大量データを使用してモデルを構築する。収集するデータは、吸収や代謝に関係のあるin vitro試験の溶解性(Sol)、Caco-2細胞を使用した膜透過性(Papp)、ヒト肝ミクロソームを使用した代謝安定性(CLint)、そしてin vivo試験で得られたヒトBAとしており、初年度の終了時点で、CLintとPappの精査したデータを、他のin vitro試験データも既に大部分が収集できた。 化合物の特徴として使用する予定である、物理化学的な記述子、化合物の部分構造を表すFinger Printについては、実装に向けた検討を行うことができた。そして各原子と繋がりをグラフとして記述子するGraph Convolutionを実装するための環境整備を開始した。BA予測に有効な記述子と組み合わせを比較検討するための環境が整いつつある。 これら複数の関連試験データを組み込むために、本研究課題では深層学習を拡張した、事前学習やマルチタスク学習などの転移学習を組み合わせて適用することとしている。事前学習とマルチタスク学習を実装するために情報収集を行い、モデルの骨格を構築に着手することができた。 以上の点から、本研究課題に関して、おおむね順調に進展していると言える。
|
今後の研究の推進方策 |
本研究課題でモデル構築に使用するデータセットは、大部分が収集できている。ただ、更なる適用範囲の拡大を目指すために、より多くのデータベースから継続してデータを収集していく。そして、化合物の特徴であるGraph Convolutionを2年目で実装し、BAの予測に有効な特徴量の検討を開始し、適した組み合わせの探索を行う。 これらのデータを基に、複数パラメータの情報を活かしながら効果的に学習を行い、モデルの構築を目指す。一方で、使用する情報が多くなるために、学習が非常に複雑になるといった問題点がある。本研究課題で予測を目指すBAは様々な要素が関わる複雑なパラメータであり、高い精度で予測することが困難であるが、これらの学習法を有効に組み合わせ、高精度で予測するモデルを構築する。構築したモデルの精度が十分でないときは、腸管および肝利用率(Fg、Fh)の関連性からCYP3Aの基質性も組み込むことを検討する。 構築したモデルは広く使えるように公開方法の検討を開始するとともに、国際誌への投稿や学会において成果を発表する。
|
次年度使用額が生じた理由 |
当初購入予定であったワークステーションと同程度の仕様のものが、安く購入できたために、2020年度の使用額を少なく抑えることができた。また、新型コロナウィルスの関係で出張が無くなったことも、2020年度の使用額が少なく完了した理由として挙げられる。 次年度の使用として、化学物質の特徴算出ソフトの保守の支払いに使用する予定としている。
|