2013 Fiscal Year Research-status Report
因果推定に基づく低分子-タンパク質間相互作用情報からの疾患関連タンパク質推定法
Project/Area Number |
25730025
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
佐藤 朋広 独立行政法人理化学研究所, ライフサイエンス技術基盤研究センター, 研究員 (00595358)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Keywords | 機械学習 / 構造活性相関 |
Research Abstract |
2013年度においては、1.低分子化合物のタンパク質阻害活性情報データベースの統合。2.Support Vector Machine(SVM)とRandom Forests(RF)を用いた相互作用予測モデルの構築。3.GPGPUを用いた統計処理の環境構築の3項目を実施した。 機械学習による活性予測モデル構築の対象となるタンパク質として、低分子化合物の阻害活性情報ータベースChEMBLから、経口投与薬に適した物理化学的特性を持つ活性化合物が50化合物以上存在する標的タンパク質を抽出し、271タンパク質を選択した。現在までのところ、低分子化合物に対して200以上のタンパク質についての活性予測結果をプロファイリングした研究報告はなく、本年度に収集したデータは、低分子化合物の複数のタンパク質に対する相互作用を考慮した標的タンパク質予測モデルの構築を行うという本研究の目的に対して充分なものであると考えられる。 ChEMBLから収集した低分子-タンパク質間相互作用情報に対して、実測値が存在しない化合物-タンパク質間の相互作用情報の補完を行うため、各標的タンパク質について機械学習による予測モデルの構築を行った。説明変数としては低分子化合物に関する2次元構造記述子MACCS keysおよびECFP4を用い、機械学習手法としては、SVMおよびRFを採用した。構築した予測モデルを用いてベイジアンネットワークを用いた解析対象の欠損情報の補完を行う事を予定している。 本研究では、大量の低分子-タンパク質間相互作用情報の処理を高速に計算するため、GPGPUを用いたSVM計算環境の整備を行った。本システムは約3000化合物の情報を用いた学習モデルの構築を、従来のCPUを用いた計算の約10分の1の時間で完了でき、来年度以降の研究においても大量のデータを効率的に処理することに寄与することが期待される。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究の計画において、2013年度には低分子化合物-タンパク質間相互作用情報の収集とデータの統合、および収集したデータを用いて機械学習を用いた予測モデルを構築して情報の欠損を補完することを予定していた。 研究実績の概要に記載した通り、2013年度は当初計画に記載した項目を概ね完了しており、現在までのところ公布申請書に記載した計画の通りに進展していると考えている。
|
Strategy for Future Research Activity |
2013年度は概ね交付申請書に記載した計画通りに進行しており、2014年度においても当初の計画に従って研究を推進することを予定している。
|
Expenditure Plans for the Next FY Research Funding |
物品購入費について端数が発生したため、240円の次年度使用額が生じた。 本研究の成果発表のための旅費、または研究成果のデータ保存用の記憶媒体の購入に使用することを予定している。
|