一般集団での頻度が高い病気(common disease)の遺伝的要因として、タンパク質の質的変化をもたらすような多型よりも、発現量に影響をあたえるような多型の関与が大きいことが明らかになっている。また、遺伝子の発現には転写開始点の周辺領域の転写因子結合配列が重要であることが知られている。このような転写開始点の多型の全容を明らかにするため我々はdbQSNPデータベースを作り、日本人集団における多型の検出およびアレル頻度決定を行ってきた。転写開始点周辺領域での欠失・挿入変異は転写因子結合に大きな影響を与える可能性があるため、これに注目した。これまで、約800個の欠失・挿入多型を見つけており、そのうち360個は日本人サンプルでのアレル頻度が5%以上のものであった。これらの半分以上は我々が新規に見出したものであった。さらに、アレル頻度5%以上のものについて、転写因子結合配列データベース(transfac)の最新版で解析したところ約1/4は既知の転写因子結合配列のなかにあった。これらが、実際に遺伝子発現に影響を与えているかを調べるためには多数の検体で統計的解析を行う必要があるので、多検体で遺伝子発現とgenotypeとの相関を調べたデータベース(ミシガン大学Liang博士らが作製)により各遺伝子の発現が近傍の多型による影響を受けやすいかどうかを検討した。その結果、これらのうち数個に発現への強い遺伝的影響が検出された。これらについて、われわれが構築した決定的ハプロタイプデータベース(D-Haplo)で周辺のハプロタイプ構造を解析し、転写配列結合配列の多型がアレル特異的発現に関与している可能性を示した。
|