オリゴキャップ法による完全長cDNAライブラリーを、ヒト正常組織、癌組織(、癌細胞由来細胞株、正常細胞株よりmRNAを抽出し、25種類を作製し、本年度までに、総数で約45万の5'端EST決定を行った。5'端ESTのうち、約25万を使用し、そのクラスタリングとGenbankデータとのhomology解析を行った。その結果、約8000の既知遺伝子の転写開始部位を同定するに至った。このデータと、ゲノムドラフト配列を比較した結果(比較時点でドラフト配列のカバー率60%)、約8000の遺伝子について、プロモーター領域を含むと考えられる転写開始点上流1000塩基長のゲノム配列を得ることが出来た。 これらのデータを、元に、転写開始点データベースDBTSSを作製し、公開した。 一方、機能未知の遺伝子の転写開始点は、現在約4000の遺伝子につきプロモーターが分かった。これは、さらに多数のプロモーターを集め、SNP解析、特許申請などを考慮中である。共同研究下で行っている、機能未知cDNAクローンの全長シークエンスで得られた配列データを、ドラフト配列上への、張り付けを引き続き行った。その結果を解析し、「ゲノム医科学」向け専用ホームページにて公開中である。さらに、完全長cDNAデータを用いてプロテオーム解析用のタンパク質データベースの整備を開始した。機能未知タンパク質の細胞内局在を1000クローンにつき決定した。
|