2021 Fiscal Year Annual Research Report

血漿タンパク結合データを利用した分布容積予測モデルの構築

Research Project

Project/Area Number	19K16436
Research Institution	National Institutes of Biomedical Innovation, Health and Nutrition
Principal Investigator	渡邉怜子国立研究開発法人医薬基盤・健康・栄養研究所, 医薬基盤研究所 AI健康・医薬研究センター, プロジェクト研究員 (30727326)
Project Period (FY)	2019-04-01 – 2022-03-31
Keywords	分布容積 / インシリコモデル / 薬物動態パラメータ
Outline of Annual Research Achievements	最終年度はまず、識別すべき特徴を自動的に学習できるディープラーニングの使用を検討したが、大量のデータが必要であるディープラーニングの適応は見送ることとした。分布容積における追加データの収集のためにACD perceptaを利用し、最終的に1314化合物のデータセットを構築した。次に、昨年度から引き続き血漿タンパク結合率の予測値を記述子の１つとして利用し、機械学習法（LightGBM, Random Forest、Support Vector Machine、Artificial Neural Network、k-Nearest Neighbors、Partial Least Square、Adaboost）による予測モデルを構築した。最も精度のよかったLightGBMを用いて予測モデルを最終化した。研究機関全体を通じて、収集した1314化合物の分布容積データを用いて、機械学習法により分布容積の数値を回帰モデルにより予測した。Test setの予測結果はR2=0.63, RMSE＝0.40であり、既存モデルと同等の精度を示した。さらに、血漿タンパク結合値を記述子として入力した場合とそうでない場合の精度比較を実施し、予測モデルは血漿タンパク結合値の入力に関わらず同等の精度を示すことが明らかとなった。今後の課題として、予測血漿タンパク結合値の精度が不十分であることが考えられることから、分布容積のデータセットに含まれる化合物において実測の血漿タンパク結合値の収集が効果的を考えられた。