ヒトゲノムのコピー数変異 (CNV) は、ゲノム配列が重複・欠失することで配列の多様性を与える変異であり、薬剤代謝酵素などの重要な遺伝子の発現量や、様々な疾患のリスクに関係していることが知られている。本研究では配列の違いも含めた CNV の多様性解明を目指し、シークエンス技術やマイクロアレイのデータを用いて CNV 同定手法の開発を行った。
今年度は、主に短鎖型シークエンスデータのバイアス補正手法とコピー数定量手法、および配列差の推定手法の開発を行うことを計画していた。まず、従来の CNV 同定アルゴリズムを改良し、ゲノム配列の GC 含量と集団データのトレンドに基づくコピー数予測の手法を開発した。国際リファレンスゲノムに含まれない新規配列を検出する研究において、本手法を用いたコピー数定量解析を行い、論文投稿を行った。また、 GC 含量以外の情報を含めたリード定量のバイアスを補正するため、シークエンスリードの周辺配列を入力としたバイアス予測手法を開発した。この方法は集団データを利用しないため、変異の境界が一定でない領域や低頻度の CNV 検出への活用が見込まれる。
今後 CNV の多様性が形質に与える影響を調べる上で、形質の関連解析のために多数のサンプルの遺伝子型を同定できることが重要である。そこで SNP アレイを用いた CNV 推定アルゴリズムの開発も行った。特に、長い重複変異のインピュテーションが難しいことが明らかになったが、インピュテーションとジェノタイピング手法を相補的に用いる新規手法を提案し、復元精度が大きく改善することを示すことができた。また、提案手法の有効性を検証した結果について、国際学会での発表を行った。本研究の結果、より正確な配列の解読、コピー数定量、および未観測の遺伝子型の推定を可能にする成果が得られた。
|