コピー数多様性(CNV)のようなゲノム構造多型は疾患感受性や薬剤応答などの個人差に影響を与える。しかし、複雑な構造多型を通常の2倍体細胞由来のゲノム解析によって決定することは困難である。そこで我々は単一精子由来の全領域ホモ接合ゲノムをもつ全胞状奇胎検体(CHM)のマイクロアレイ解析により170万個のSNPおよび2339領域のCNVからなる確定ハプロタイプを決定してきた(D-HaploDB Phase 4として公開:http://orca.gen.kyushu-u.ac.jp/)。本研究は、当初の計画では少数サンプルの全ゲノムを超並列シークエンサーで解析し新規にアセンブルすることで構造多型を確定することを目指していた。しかし、目的を遂行するためには長鎖リードが不可欠であるが、現状での全ゲノム解析では複雑なゲノム構造多様性に関する十分な情報を得ることが困難であることが判明した。そこで、D-HaploDBで検出したCNV領域に絞って全74検体のCHMを対象として塩基配列解析を行うことにした。特に薬物代謝に関連する遺伝子に着目し、UGT2B17、GSTT1ですでに知られている欠失のbreakpointを確認した。これらのように頻度が高い既知の欠失に加えて、新たにGSTA2-GSTA1領域の低頻度の欠失も検出した。そのbreakpointはGSTA1、GSTA2両遺伝子のintron 2にあり、相同な領域での組換えにより融合遺伝子が形成されていることが判明した。これにより、コードするグルタチオンS-転移酵素αのアミノ酸配列の一部が変化し、また発現量が減少することにより、同酵素が関与する薬物代謝に影響を及ぼすことが予想される。同じ欠失はヒトリンパ芽球細胞でも検出された。この結果はCHMゲノムの解析が低頻度の構造多型を解明するのに有用であることを示している。
|