今年度中に、タンパク質-タンパク質インタラクション・サイトを予測する提案された方法のために、我々はコア・モジュールを完成した。この方法では、我々は2つの異なるタンパク質の配列情報をとり、各々のアミノ配列にある残基の特性を計算によって取得する。それから、その1つの配列からのすべての残基は、もう一方のタンパク質配列からの各々の残基と結合させる。Position Specific(Scoring Matrix(PSSM)を用いて、目的残基とその周辺の残基の合成特徴ベクトルが構築される。そして、その残基対が結合するかを予測するモデルをトレインする。トレインされたモデルは、予測の可能性を残基対ごとに提供する。このモデルは、従来の方法より的確に予測でき、ペアワイズ残基をも予測できる。Jackknifeクロス検定を用いたペアワイズ予測のための曲線下面積(ROCのAUC)が、72.4%であることが示された。この方法を用いた相互作用しているペアを予測するウェブサーバはすでに開発されhttp://tardis.nibio.go.jp/netasa/ppipp/.で利用可能となる。 この方法を広げて、タンパク質・タンパク質パートナーを予測するために、我々は一般公開されるデータセットのローカル・レポジトリを構築したかった。この目的のために、タンパク質・タンパク質インタラクションのおよそ14のデータセットはローカル・データベースに情報を蓄積された。主要なデータベースはHPRD、BiogridとDIPなどがある。これらの進展と最新状況の詳しい情報はすでに蓄積されている。次年度の研究計画に従って、これらが更なる分析と予測方法の開発のために利用される。
|