研究課題/領域番号 |
26870045
|
研究機関 | 東北大学 |
研究代表者 |
村上 洋一 東北大学, 情報科学研究科, 教育研究支援者 (20548424)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | バイオインフォマティクス / タンパク質間相互作用予測 / タンパク質機能 / アミノ酸保存度 / アミノ酸残基 / 機械学習 / 予測 / 創薬支援 |
研究実績の概要 |
本研究では、与えられた蛋白質のアミノ酸配列情報のみから、他の蛋白質と相互作用する可能性が高いアミノ酸残基(以下、相互作用部位と呼ぶ)を予測する手法を高度化する。またこの手法を、与えられた蛋白質と相互作用する相手の蛋白質を予測する手法とパイプライン化し、相互作用部位の予測結果や二次構造情報、さらにアミノ酸残基の変異情報等を付加した出力インターフェースを開発することを目指している。本年度は、これまでに開発した相互作用部位の予測手法(PSIVER)に、特徴値間の緩い依存関係を仮定した機械学習法である Averaged One-Dependence Estimators (AODE)を導入し、交差検定による予測性能の評価を行った。その結果、特徴値間の依存関係を考慮しない従来法よりも高い性能を得ることができた。また現在、各アミノ酸残基に対して予測した二次構造情報を新たな特徴値として加え、予測モデルの再構築とその性能評価を行っている。さらに、与えられた蛋白質と相互作用する相手の蛋白質を予測する手法の開発基盤となる蛋白質間の相互作用予測手法(PSOPIA)を論文として発表した(Murakami and Mizuguchi, 2014)。また大規模なヒトの相互作用データをテストセットとして、PSOPIAが新規の相互作用を予測できるのかについて検証を行った。その結果、相同性の高い相互作用が既知でない場合であっても、ドメイン間の相互作用傾向や相互作用ネットワーク上で最も類似した蛋白質間の最短距離情報から新規の相互作用を予測できる可能性を示した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度の研究実施計画では、アミノ酸配列情報のみから予測した二次構造予測の結果を新たな特徴値として加えて、相互作用部位のAODE予測モデルを構築する計画であった。しかしながら、AODEの実装とその有効性の検証に時間を要してしまった。また、次年度に開発を計画している手法の基盤となる技術の論文化に伴う追加的な性能評価に時間を要してしまった。以上の理由から、新たな特徴値の導入までを年度内に終えることができなかった。
|
今後の研究の推進方策 |
予測した二次構造予測の結果を新たな特徴値として加えて、相互作用部位のAODE予測モデルの構築とその性能評価を早急に実施する。また、与えられた蛋白質とデータべースに格納されている各蛋白質をペアとして、それらが実際に相互作用するのかを高速に予測する手法を開発し、さらにどの蛋白質と最も相互作用する可能性が高いのかを順位付けするアルゴリズムを開発する計画である。さらに、この新規手法によって予測した結果に、相互作用部位の予測結果や二次構造情報、またアミノ酸の変異情報や創薬標的探索に有用なアノテーションを付加し、グラフィルカルな出力インターフェースを開発する。また公共的に利用可能なWebサーバを構築し公開する計画である。
|
次年度使用額が生じた理由 |
助成金の申請時に希望していた物品購入費からの大幅な減額があったために、計算機の購入計画の見直しを行った。大規模かつ高速な計算が必要な場合は、所属する研究室が契約している並列クラスター計算機を利用させていただくようにし、手元の端末計算機またWebサーバ構築用の計算機として小規模な計算機を購入することにした。また本年度は、研究計画にやや遅れを生じてしまったために、学会発表等で研究成果を発表する機会をあまり持つことができなかった。以上の理由から、物品費と旅費について次年度に生じることになってしまった。
|
次年度使用額の使用計画 |
研究成果を論文や学会等で発表する際に必要な各種ソフトウェア、また大規模なデータを一時保存あるいはバックアップするために必要な高速な入出力が可能な外部記憶装置の購入を計画している。また、研究成果を国内外で発表および情報収集や情報交換を行うための旅費として使用する。
|