全ゲノム配列が発表されている生物種はついに60を越えた。生体で機能している高分子は大部分がタンパク質であるため、集積された塩基配列にどのような機能を持ったタンパク質があるかを知る必要がある。しかし、ゲノム配列からタンパク質の機能を推定する方法はまだ確立していない。申請者らはラン藻のゲノムにコードされているある一つのORFの機能予測を、モジュール3Dキーノートの方法と他の方法を組み合わせることで成功した。モジュール3Dキーノートとは、立体構造及び機能部位が類似であるモジュールから抽出したアミノ酸配列ペアーのパターンである。これを受けて本研究課題では、モジュール3Dキーノートの方法の一般化と自動化を目指している。本年度はProtein Date・Bank(PDB)からタンパク質と基質や補酵素などの相互作用部位を自動抽出し、各種の機能のモジュール3Dキーノートの自動作成方法の確立を試みた。その結果、約200種類のモジュール3Dキーノートを作成することに成功した。40%はATPなどの核酸関連のモジュール3Dキーノート、30%は金属イオンのモジュール3Dキーノート、10%はヘムのモジュール3Dキーノートであった。新規のモジュール3Dキーノートを作成すると同時に、それらの予測精度を評価した。機能が詳細にわかっているタンパク質に対してモジュール3Dキーノートを適用し、どの程度わかっている機能を予測できるかを調べることで、3Dキーノートの予測精度を評価することができる。その結果、新規にできたモジュール3Dキーノートは平均約85%の精度を持つことがわかった。これらのモジュール3Dキーノートをラン藻全ゲノムに適用したところ、機能未知ORFの約12%に機能を推定する手がかりを与えることができた。来年度はモジュール3Dキーノートのデータベース化を実行する。
|