本研究では、ゲノムスケールでの転写因子とターゲット予測を行い、以下のような成果を得た。 (1)転写因子の予測: これまでに、配列組成やコンテクスト情報、アラインメントを利用した進化情報、および構造情報を利用して、蛋白質がDNAに結合するかどうかを予測する方法を開発してきた。次に、結合蛋白質全体およびドメインごとに予測を行った。その結果、蛋白質の全領域の配列を用いた予測のほうが、DNA結合ドメインのみを用いた予測よりも明らかに高い予測精度が得られた。これらの方法の予測精度をゲノムスケールで検証するため、酵母のすべてのORFについて全配列を用いた場合とドメインごとの予測を行った。 (2)転写因子のターゲット予測: これまでに開発してきた転写因子のターゲット予測法のうち、蛋白質・DNA複合体の構造情報に基づくターゲット予測法については、予測精度を向上させるため、蛋白質・DNA複合体の構造データベースの更新を行った。これにともない、蛋白質・DNA認識の特異性およびターゲット予測の精度が全体的に高まった。蛋白質・DNA認識は、アミノ酸と塩基に直接相互作用による直接認識とDNAの構造や物性をとおして配列を認識する間接認識とがあるが、間接認識では、DNAの配列に依存したコンフォメーションエネルギーを評価するためにDNAの計算機シミュレーションも行った。これまでの結果では、蛋白質・DNA複合体について、統計ポテンシャルと同様な特異性を得ることができた。これまでに開発されたいろいろなターゲット予測法を用いて、酵母ゲノムについて解析を行い、既知のターゲットと比較したところ、大部分のターゲットは合致していた。現在、予測された結果をCHIP-Chipデータと系統的に比較している。 (3)データベース・ツールの開発と公開: これまでに、転写因子やターゲット予測に関係したデータベース・解析ツールを開発しインターネットで公開してきたが、これらのデータ更新や機能強化を引き続き行った。また、転写制御に関する各種データベースや解析ツールなどを集めた転写制御ポータルサイトを作成し公開を始めている。
|