本年度は、次の課題に関して以下のような成果を得た。 (1)転写因子の予測:蛋白質がDNAに結合するかどうかを予測するため、本年度はまず、DNA結合蛋白質のデータセットの追加を行った。この新しいデータを用いて、これまでに開発した配列情報、進化情報、および構造情報を利用した予測方法に基づき、DNA結合蛋白質全体、DNA結合ドメイン、および、非DNA結合蛋白質について計算を行った。その結果、蛋白質の全領域の配列よりも、DNA結合ドメインのみを用いたほうが予測確率が高いという傾向が得られた。また、構造情報がある場合は、構造モデルを構築した上でDNA結合蛋白質の予測も行い、予測精度が上がることが確かめられた。また、これらの方法を酵母ゲノムのORFで機能未知の遺伝子の機能解析に応用した。 (2)転写因子のターゲット予測:これまでに開発した蛋白質・DNA複合体の構造情報に基づく予測法を用いて、アミノ酸と塩基に直接相互作用による直接認識とDNAの構造や物性をとおして配列を認識する間接認識のそれぞれについて、蛋白質・DNA認識の特異性の計算やターゲットの予測を行った。直接認識と間接認識の組み合わせ、および、配列に基づく予測法との組み合わせで予測を行うことにより特異性が上昇し予測精度が上がることが示された。間接認識については、DNAの配列に依存したコンフォメーションエネルギーを評価するためにDNAの計算機シミュレーションも行った。 (3)データベース・ツールの開発と公開:蛋白質・核酸相互作用熱力学データベース、複合体構造データベースなどのデータ更新、蛋白質・DNA認識の特異性を計算するWebサーバ、ReadOUT、の更新、ストラクチュロームにおける分子相互作用ネットワークのツール、PDBnet、のデータの更新、転写制御ポータルサイトの更新などを行った。
|