研究課題/領域番号 |
25730025
|
研究種目 |
若手研究(B)
|
研究機関 | 独立行政法人理化学研究所 |
研究代表者 |
佐藤 朋広 独立行政法人理化学研究所, ライフサイエンス技術基盤研究センター, 研究員 (00595358)
|
研究期間 (年度) |
2013-04-01 – 2015-03-31
|
キーワード | 機械学習 / 構造活性相関 |
研究概要 |
2013年度においては、1.低分子化合物のタンパク質阻害活性情報データベースの統合。2.Support Vector Machine(SVM)とRandom Forests(RF)を用いた相互作用予測モデルの構築。3.GPGPUを用いた統計処理の環境構築の3項目を実施した。 機械学習による活性予測モデル構築の対象となるタンパク質として、低分子化合物の阻害活性情報ータベースChEMBLから、経口投与薬に適した物理化学的特性を持つ活性化合物が50化合物以上存在する標的タンパク質を抽出し、271タンパク質を選択した。現在までのところ、低分子化合物に対して200以上のタンパク質についての活性予測結果をプロファイリングした研究報告はなく、本年度に収集したデータは、低分子化合物の複数のタンパク質に対する相互作用を考慮した標的タンパク質予測モデルの構築を行うという本研究の目的に対して充分なものであると考えられる。 ChEMBLから収集した低分子-タンパク質間相互作用情報に対して、実測値が存在しない化合物-タンパク質間の相互作用情報の補完を行うため、各標的タンパク質について機械学習による予測モデルの構築を行った。説明変数としては低分子化合物に関する2次元構造記述子MACCS keysおよびECFP4を用い、機械学習手法としては、SVMおよびRFを採用した。構築した予測モデルを用いてベイジアンネットワークを用いた解析対象の欠損情報の補完を行う事を予定している。 本研究では、大量の低分子-タンパク質間相互作用情報の処理を高速に計算するため、GPGPUを用いたSVM計算環境の整備を行った。本システムは約3000化合物の情報を用いた学習モデルの構築を、従来のCPUを用いた計算の約10分の1の時間で完了でき、来年度以降の研究においても大量のデータを効率的に処理することに寄与することが期待される。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の計画において、2013年度には低分子化合物-タンパク質間相互作用情報の収集とデータの統合、および収集したデータを用いて機械学習を用いた予測モデルを構築して情報の欠損を補完することを予定していた。 研究実績の概要に記載した通り、2013年度は当初計画に記載した項目を概ね完了しており、現在までのところ公布申請書に記載した計画の通りに進展していると考えている。
|
今後の研究の推進方策 |
2013年度は概ね交付申請書に記載した計画通りに進行しており、2014年度においても当初の計画に従って研究を推進することを予定している。
|
次年度の研究費の使用計画 |
物品購入費について端数が発生したため、240円の次年度使用額が生じた。 本研究の成果発表のための旅費、または研究成果のデータ保存用の記憶媒体の購入に使用することを予定している。
|