研究課題/領域番号 |
16K00388
|
研究機関 | 東京工業大学 |
研究代表者 |
松崎 由理 東京工業大学, 情報生命博士教育院, 特任助教 (30572888)
|
研究分担者 |
内古閑 伸之 中央大学, 理工学部, 助教 (20397483)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | タンパク質ドッキング / タンパク質間相互作用 / タンパク質間相互作用ネットワーク |
研究実績の概要 |
本研究では,網羅的タンパク質ドッキングによって対象タンパク質群から相互作用し得るペアを予測する.まず,既存手法を改良して 1. 網羅的タンパク質ドッキングによる高精度な相互作用予測手法の開発を目指す.次に,熱帯病を引きおこす寄生原虫のタンパク質,熱帯病の原因となるウイルスと宿主であるヒトのタンパク質を対象にこの手法を適用して2. 熱帯病関連タンパク質間相互作用の探索を実施する.さらに,これまで少数の既知タンパク質複合体の立体構造データから限定的に議論されてきたウイルス-宿主タンパク質間相互作用の特徴について,3. ドッキング結果に基づくウイルス-宿主タンパク質間相互作用の解析を行ない,新たな知見につなげることを目指す. 平成28年度は 1. 網羅的タンパク質ドッキングによる高精度な相互作用予測手法の開発を目的として研究を進めた.既存のPPI予測手法を,ドッキング高スコア構造群の相互作用残基プロファイルを組み合わせて改良し,一般的なベンチマークデータを用いて精度を検証することを目標とした.その結果,ベンチマークデータへの適用においては,予測精度が向上することを確認した.そこで,対象をさらに広げてヒトのタンパク質間相互作用作用を対象に同手法を適用し,より広い対象での試験を行うこととした.現在結果の検証中であるが,一部の結果からは,予測の有効性が対象とするタンパク質によって大きく変わることが見られた.本手法では,ドッキングの結果得た相互作用プロファイルを入力とし,既知のタンパク質間相互作用情報を学習して予測モデルを構築する.そのため,既知の情報が少ないタンパク質については,相互作用相手の予測に失敗しやすくなっていると考えられる.今後はこの点を解消するべく手法の改良を進めながら,計画しているヒトとウイルス間のタンパク質間ドッキングと相互作用予測を進めていく.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成28年度は 網羅的タンパク質ドッキングによる高精度な相互作用予測手法の開発を目的として既存のPPI予測手法にドッキング高スコア構造群の相互作用残基プロファイルを組み合わせて改良し,一般的なベンチマークデータを用いて精度を検証することを目標とした.まず,高スコアドッキングモデル群の相互作用残基プロファイル表現方法の開発を行った.具体的には,ドッキングの結果得られた数千の高スコア構造群で相互作用に利用されている残基の集合を,ドッキングスコアと組みあわせたプロファイルとして表現した.このデータを入力とし,SVM, Extra-trees などの機械学習手法を用いた予測手法を開発した.この手法について,一般的に用いられているベンチマークデータ(230のターゲットタンパク質)への適用において精度の向上を確認した.目標とする手法を開発し,ベンチマークセットでの精度の確認を行ったという点で,研究計画は順調に進んでいると言える.しかし,実データ(ヒトのタンパク質間相互作用ネットワークの予測)を用いてさらに検証を進めたところ,開発手法では高い精度を得られない事例が多く出てきた.原因の一つとして,予測モデルを構築するために学習する既知の相互作用情報が十分にないタンパク質については,予測モデルをうまく構築できない場合があるのではないかと考えている.現在の予測手法では,対象とするタンパク質ごとに予測モデルを立てているが,より一般化したモデルの構築を行うことで,予測精度の低い対象について精度を向上させられる可能性がある.計画していた手法の開発と試験は実施できたため全体としては順調に進んでいるが,新たなデータへの適用で手法の問題点が明らかになり,改善が必要と判断したため「おおむね順調」と評価した.
|
今後の研究の推進方策 |
平成29年度は提案手法を実データに適用し,熱帯病関連タンパク質間相互作用の探索を実施する.平成28年度の研究で明らかになった問題点について手法の改良を同時に進める.得られた新規相互作用候補については,新たに加わった生物学実験の経験が豊富な研究分担者と議論し,興味深い事例1~2件については検証するための相互作用実験を実施する. 寄生原虫 T. cruzi のPPIと,デングウイルス-ヒトPPIの予測を行う.T. cruziについて,517の立体構造データを収集済である.網羅的PPI予測に必要なドッキング計算の規模は517*517=267,289件程度を見込んでいる.デングウイルスについては83構造,ヒトについては30,544構造を収集済である.ヒトのタンパク質構造については,過度に冗長なデータを除去するなどして10,000構造程度にしぼり,830,000件程度のドッキング計算を実施する.この結果,信頼度の高い新規PPI候補に生物学的意義を見いだせなかった場合には,配列,立体構造の両面から,予測されたタンパク質ぺアに類似するタンパク質を検索し,考察の範囲を広げる. 熱帯病関連タンパク質間相互作用の探索においては,予測された相互作用を実際に生物学実験で検証することが最終目標となる.予測された相互作用の中から生物学的な意義の大きいものを選択して適切な実験方法を議論する.実験を実施するには高額の費用が必要になる.この段階で価値のある新規発見につながる実験計画を立てられた場合には,数例の予備実験を本予算の範囲で行った上で別途研究計画を立案し,研究予算を確保する. 平成30年度には,ドッキング結果に基づくウイルス-宿主タンパク質間相互作用の解析を目的として,既知ヒトPPIとウイルス-ヒトPPIの比較を実施する.
|
次年度使用額が生じた理由 |
研究計画をこえて新たな計算実験を実施することを優先し、バックアップのためのデータストレージ等一部消耗品は、計算実験の目途が立ってから購入することとした。そのためわずかに次年度使用額が生じた。
|
次年度使用額の使用計画 |
当初の研究計画通り、大規模な計算器実験を実施するための並列計算機利用料、国際会議での発表のための研究調査旅費を主な支出とする。当該年度に購入しなかったバックアップ用データストレージの他、タンパク質間相互作用の検証実験のための消耗品を購入する。
|