研究概要 |
本年度は、次の研究をを行った。 ・従来の遺伝子の機能注釈付けでは、その多くがデータベースの相同性検索やHMMなどで表現されたモチーフのサーチなど、データベース中の個々のデータとの1対1の個別比較の結果に基づいていたため、得られたスコアが有意かそうでないかの判定が困難であった。本研究では、まず配列データ全体を相同性に基づくクラスタリングによりクラスタに分類し、各クラスタから相互の相同性のもとになっている領域をモチーフとして求めた。その後、モチーフからHMMを作成し、元の配列データに既存の配列データベースの配列を加えたものに対してHMM検索を行い、モチーフを持つと判定された配列をファミリと見なした。ファミリの配列はモチーフの領域で多重アライメントして比較でき、機能注釈付けはファミリ全体で行える。このため、従来の1対1比較よりも偶然の類似が入り込みにくいなど信頼性の高い機能注釈が付けられた。理研ゲノム科学総合研究センターにて配列決定されたマウス完全長cDNA配列(配列数約21,000個)を配列相互の類似度によりクラスタリングし、その中で共通に保存されているモチーフ候補を探索し、その中からInterProなどの既存のデータベースに登録されているものを除くことで9個の新規モチーフ候補を得たが、そのうちの6個については既知遺伝子との相同性、染色体上の位置、タンパク質2次構造予測、膜貫通領域予測など種々の解析から機能注釈付けを行った。 ・理研ゲノム科学総合研究センターにて作製されたマウスcDNAマイクロアレイ(cDNA数約19,000個)により得られた、マウスの種々の発生時期や臓器での遺伝子の発現データのデータベースを開発するとともに、発現データのクラスタリングにより種々の発生時期や臓器特異性、代謝パスウェイに関与している一群の遺伝子を明らかにした。
|