研究課題/領域番号 |
26870045
|
研究機関 | 国立研究開発法人医薬基盤・健康・栄養研究所 |
研究代表者 |
村上 洋一 国立研究開発法人医薬基盤・健康・栄養研究所, 医薬基盤研究所 バイオインフォマティクスプロジェクト, プロジェクト研究員 (20548424)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | バイオインフォマティクス / タンパク質間相互作用予測 / タンパク質機能 / アミノ酸保存度 / アミノ酸残基 / 機械学習 / 予測 / 創薬支援 |
研究実績の概要 |
平成27年度は、前年度に論文発表を行った与えられた2つの蛋白質の相互作用の可否を予測する方法であるPSOPIAを応用して、与えられた1つの蛋白質に対して、公共データベースのUniProtKBに登録されているヒトの各蛋白質との相互作用の可否の予測を自動的に行い、また予測したスコアに従って順位付けをするシステムを開発した(以下、PSOPIA-Xと呼ぶ)。本システムの開発に際して、統合データウェアハウスであるTargetMineから論文の引用件数が2件以上あるヒトの相互作用データを取得し、新たに相互作用を予測するためのAverage One-Dependence Estimator (AODE)を用いた機械学習モデルを構築した。訓練データセットは、ある相互作用する蛋白質ペアの双方の配列との配列類似度が40%以上である他の相互作用ペアを含まない非冗長なポジティブデータセットを準備し、また同様の制約条件で作成した相互作用ペア以外の網羅的なタンパク質の組み合わせによって作られたネガティブデータセットを準備した。これはポジティブデータセットの約770倍の数のであった。また、膨大な数の候補蛋白質との相互作用予測の計算を高速に実行する必要があるため、UniProtKBに登録されているヒトの全ての蛋白質に対して必要な前処理を行った結果をデータベース化し、また並列的に計算をするプログラムの開発及びシステム環境の整備を行った。さらに、交差検定の結果に基づいて、相互作用すると予測された候補蛋白質のうち実際に相互作用する蛋白質の陽性的中率が高くなる予測スコアの閾値を決定した。加えて、予測した候補蛋白質リストに対して、TargetMineを用いたパスウェイや遺伝子オントロジー等の解析した結果を付加したPSOPIA-Xの予測結果の出力インターフェースを現在開発中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成27年度は、研究計画通り、与えられた蛋白質とデータベースに登録されている各蛋白質とをペアとして、その相互作用の可否を高速に予測して順位付けするシステムを開発し、その性能評価を行うことができた。しかしながら、PSOPIA-Xの高速化に必要なプログラム開発や予測結果の出力インターフェースの開発等に時間を費やしてしまったため、相互作用部位を予測する手法(以下, PSIVERと呼ぶ)の高度化については、アルゴリズムの改良を行ったが、その性能評価を本年度中に終えることができなかった。
|
今後の研究の推進方策 |
PSOPIA-XのWebサーバの構築、またアルゴリズムの改良を行ったPSIVERの性能評価を優先して行う。その後、PSOPIA-XとPSIVERをパイプライン化して、与えられた1つ蛋白質に対して相互作用する可能性の高い他の蛋白質を予測し、そしてそれらの候補蛋白質の各々に対して相互作用部位を予測するシステムを開発する。またそれらの予測結果に、二次構造や変異の情報また構造が既知の場合には外部の構造データベースへリンク等を加えた出力インターフェースを開発する。当該システムは、公共的に利用可能なWebサーバとして公開する。
|
次年度使用額が生じた理由 |
当該年度の直接経費についてはほぼ使用計画通り支出を行ったが、前年度に生じた当該年度使用額に相当する額については使用しなかった。その分については当該研究課題の最終年度に、サーバ構築に必要な経費として使用することにした。
|
次年度使用額の使用計画 |
サーバ構築に必要な機器又はソフトウエアの購入及びその他必要経費等に使用し、また論文出版費として使用する計画である。
|