これまでに得られた肺癌の臨床検体ChIPシークエンシング結果からデータ品質の良い症例を選び、より多くのリード数と長いリード長で再度シークエンシング行った。このデータをもとに、非コード制御領域の体細胞変異とSNPsを得た。これらのサイトから55個所を選びPCRプライマーをデザインすることで、他の症例についてもアンプリコンシークエンシングを行った。結果としては、ChIPシークエンシングによるバリアントコールはFalse positive変異コールはインフォマティクス解析の工夫で効果的に除去できるが、細胞数の少ない傾向のある正常組織のChIPシークエンシングデータ品質は全体的に癌組織に劣り、SNPを体細胞変異とコールしている場合もあった。非コード領域におけるRecurrentな体細胞変異を期待していたが、本研究では同じ塩基位置に出現する「ホットスポット」は多数検体のアンプリコン解析でも見つからなかったものの、200塩基対程度の同じアンプリコン内で複数症例で検出できる体細胞変異は確認でき、機能的意義の解析や臨床情報との相関の解析に進められる候補領域が発見できた。 東北メガバンクのデータベースにアレル頻度情報の無い「Private SNPs」は各症例の非コード制御領域に多数あった。全ゲノムシークエンスを行うアプローチに比べ低コストでエピゲノムプロファイルを加えたゲノム・エピゲノム統合解析が行える点でも、今後も臨床検体解析に応用できる十分な成果があった。H3K4me3でマークされた遺伝子プロモーター領域やH3K27acマークのある非コード制御領域におけるアレル特異的制御と対応するSNP、および、体細胞変異とは関係なくエピゲノム制御によって癌特異的に発現しているnon-canonical exonについても、今後機能解析やバイオマーカーとしての開発を続ける。
|