計画研究
次世代型シーケンサーの登場により、これまでの医療から個人の全ゲノム情報を活用したパーソナルゲノム医療への転換が可能となりつつある。しかしながら、 ヒトゲノム上に存在する多型を高感度かつ高精度に抽出するためには、配列の精度や解析プロトコールの整備が重要な課題である。本研究では、HiSeq2500 (Illumina:HiSeq2000からアップグレード)を用いたゲノム解析技術の開発および全ゲノム配列決定によりヒトの脳疾患(アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症、脊髄小脳変性症、統合失調症など)に関与する多型を明らかにし、その発症機構の解明を目指している。これまでに、ペアエンドシーケンス用のインサートサイズが均一でバイアスがかかりにくい鋳型調製法を開発するとともに、種々のキット(Nexteraキットなど)との比較検討を実施した。さらに、遺伝子コピー数多型やゲノム構造多型などを検出するためには、メイトペア情報の活用が必要不可欠であり、~15kb程度までは分散が小さいライブラリ作製が可能となった。また、ロングリードの活用も構造多型の検出に有効であるため、第三世代のシーケンサーであるPacBioデータおよびMoleculo技術(long PCR産物を鋳型とする:6kb以上)を利用したHiSeqデータの評価をそれぞれ実施した。なお、1ランあたり出力されるデータ量は年々増加しており、ベースコールを含む情報解析を迅速に実行するために解析サーバの増強および解析パイプラインを構築した。現在、再同意が得られた脳疾患由来の検体を中心に全ゲノム配列決定を進めており、網羅的な多型情報の収集を行っている。得られたデータは、日本人ゲノムの多型データベース(頻度情報)および高精度な日本人ゲノムの標準配列を作成するために、本領域研究内の柱の一つであるゲノム情報解析研究グループに提供した。
2: おおむね順調に進展している
ペアエンドおよびメイトペアライブラリの作製については、成功率や精度の向上および高速化が達成された。特に、本研究で確立したメイトライブラリの作製方法は、新規ゲノム配列決定(de novo assembly)などの他の課題においても有効であった。また、ロングリード(特にPacBioデータ)を用いた構造多型の検出については、今後さらに鋳型調製における条件を検討するとともに解析に必要なデータ量や検出精度の向上を目指した解析手法を開発する。連携研究者から提供されたすべての検体については、全ゲノム配列決定が完了しており、生データはゲノム情報解析研究グループに提供済みである。
今後さらに多くの検体の全ゲノム配列決定を進めることにより、日本人ゲノムの多型データベースの構築および高精度な日本人ゲノムの標準配列の作成、脳疾患(アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症、脊髄小脳変性症、統合失調症など)の原因遺伝子の同定や発症機構の解明を目指す。また、ショートリード(HiSeqデータ)を用いた構造多型解析では、サイズが大きい挿入・欠失や遺伝子コピー数多型(CNVs)の検出が非常に困難であるため、第三世代のシーケンサー(PacBio RSII)やMoleculo技術を積極的に活用した解析手法の開発を進める。さらに、PacBioシーケンサーを用いた特定領域(HLA領域など)のアンプリコン解析や比較的大きな領域のゲノムDNAの濃縮についても効率の良い方法を開発するとともにアリル間の違いを分離した解析手法を確立したいと考えている。
すべて 2014 2013
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件)
Am J Hum Genet.
巻: 93(5) ページ: 900-905
10.1016/j.ajhg.2013.09.008.
PLoS One
巻: 8(6) ページ: e66729