2016 Fiscal Year Research-status Report
リガンドデータベースからの機械学習によるハイブリッドスクリーニング法の開発
Project/Area Number |
15K00408
|
Research Institution | Tokyo University of Science |
Principal Investigator |
大和田 勇人 東京理科大学, 理工学部経営工学科, 教授 (30203954)
|
Co-Investigator(Kenkyū-buntansha) |
青木 伸 東京理科大学, 薬学部生命創薬科学科, 教授 (00222472)
西山 裕之 東京理科大学, 理工学部経営工学科, 准教授 (80328567)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 機械学習 / バイオインフォマティクス / スクリーニング |
Outline of Annual Research Achievements |
平成28年度は,①がん放射線治療の副作用低減のためのp53標的放射線防護材の予測と,②低分子化合物結合タンパク質の予測を実施した. ①に関しては,本学薬学部生命創薬学科,青木研究室の実験データから,84個の化合物 データを用いて放射線防護機能と毒性に関してそれぞれXGBoostを用いて予測した.毒性と放射線機能についてのラベル付けは専門家の意見を参考に設定し,学習に用いた特徴は,3DモデリングソフトウェアのDiscovery Studioによって算出された217の特徴量を用いた.また,創薬分野においてよく用いられる学習器であるk近傍法,サポートベクターマシン,ランダムフォレストと精度を比較し,その有効性を示した. 特に,毒性の予測についてはXGBoostの精度は83.8%で,4つの学習器で最も高い精度を示した.本研究成果は,イギリスで実施される国際会議CIBCB2017に「Predicting Radiation Protection and Toxicity of p53 Targeting Radioprotectors using Machine Learning」というタイトルで投稿中. ②に関しては,本学理工学部応用生物学科,諸橋研究室の実験データから,低分子化合物であるイレッサ(抗癌剤)と結合するタンパク質を,ランダムフィレストを用いて学習させ,分類に関連するアミノ酸配列の抽出をした.なお,bi-gramを用いて20種のアミノ酸から400の特徴を生成し学習に用いた.結果として22個のアミノ酸配列(ジペプチド)を抽出でき,これらを用いた分類精度は約80%に達し,分類に関連すると期待できる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
①に関しては,専門家も意見を参考にした化合物のラベル付けをした.また,Discovery Studio から217の物理化学的性質を生成し4つの学習器で学習させ,その精度を比較・検討した. ②に関しては,アミノ酸配列を特徴ベクトルに変換し学習させ,イレッサに結合するタンパク質の分類に関連すると思われるアミノ酸配列(ジペプチド)を22個抽出した. 以上の様に予定通りの成果も得られており,本研究成果に基づき論文を国際会議に投稿中であることから,おおむね順調に進展しているといえる.
|
Strategy for Future Research Activity |
平成29年度は,①に関しては,生成した学習モデルを用いて実験前の化合物の放射防護機能,毒性を予測し,実験でその予測結果の検証をする. ②に関しては,特徴ベクトルの生成を改良し,低分子化合物結合タンパク質の分類に関連すると考えられるジペプチド以上のアミノ酸配列の抽出を目指す.
|
Causes of Carryover |
現在投稿中の国際会議・論文が存在し,採択および国際会議への海外出張が次年度になったため.
|
Expenditure Plan for Carryover Budget |
平成28年度に投稿した国際会議・論文の採択に伴い,その旅費や学会参加費として使用する予定である.
|