研究課題/領域番号 |
24657005
|
研究機関 | 九州大学 |
研究代表者 |
田平 知子 九州大学, 生体防御医学研究所, 講師 (50155230)
|
研究分担者 |
久木田 洋児 地方独立行政法人大阪府立病院機構大阪府立成人病センター(研究所), 研究所, 研究員 (60372744)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
キーワード | 遺伝子多様性 / ハプロタイプ |
研究概要 |
ヒトゲノム参照配列は,ゲノムワイドな遺伝子発現解析や疾患関連解析の基盤となるものであるが,現在の同配列は複数の個人のディプロイドゲノムから得られた配列断片をつなぎ合わせたものであり,複雑な構造多型を持つ領域では実際の染色体におけるハプロタイプを反映していない.また,参照配列に含まれていない配列も多数あることが知られている.このような領域を含めたゲノムの全体像を明らかにするためにはde novo アセンブリー(読み取り配列のオーバーラップのみを根拠にした結合によるゲノム配列の新規構築)が必要である.我々は全胞状奇胎(単一精子由来の倍加したハプロイドゲノムを持つ)のマイクロアレイ解析により一塩基多型(SNP)とコピー数多様性(CNV)を含めた日本人ゲノムのハプロタイプを決定し,D-HaploDBとしてデータベース化してきた.本課題ではこのハプロイドゲノムの利点を生かして,de novo アセンブリーによる新たな日本人参照配列の決定を目指している.これを行うための次世代シークエンサーを用いた解析技術はまだ発展途上であり,その問題点である読み取り長の長さも改善しつつある.この状況を考慮し,本年度は予備段階として,1)D-HaploDBのマイクロアレイデータと1000ゲノム計画におけるショートリードシークエンス結果の比較,2) 構造多型検証のためのロングPCRの条件の確立とそれによるD-HaploDBで検出されているCNVの検証,3) de novo アセンブリーのためのソフトウエアの検討,を行った.これにより,1000ゲノム計画で検出されていない低頻度の欠失を見出し確認した.またソフトウエアとしては「Cortex」(Iqbal et al., Nat. Gen. 44, 226-231, 2012)が有用であると考え,その利用を検討している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
次世代シークエンサーを用いた解析技術は急速に進歩しているため,初年度は予備的検討に重点をおき2年目に集中して解析をすることとした.具体的な解析技術の進歩としてはハード面ではシークエンサーの読み取り長が伸びてきており,それによりシークエンスのアセンブルが容易になってきている.特にde novo アセンブリーを行うためにはリード長が長いほうが圧倒的に有利である.当初の計画ではイルミナHiSeq2000を用いたペアエンド法による両側100塩基読取を受託解析により行う予定であったが,平成25年度に所属機関にHiSeq2500(両側150塩基読取が可能)が導入されることになったので,その利用が可能になってからシークエンス反応を行うことを考えた.しかしイルミナMiSeqで両側250塩基読取が可能となり,MiSeqを利用できる目途がついたので現在ではこれを使うことを考えている.ソフト面では1000ゲノム計画の進行と並行して,ゲノムのアセンブリーあるいはSNPおよびCNVの検出のための非常に多くのソフトウエアが作成されている.ヒトゲノムの全ゲノムde novo アセンブリーはディプロイドゲノムを用いた場合は困難なのでまだ報告されておらず,このような挑戦的な課題に取り組むために適したソフトウエアの検討に時間を要した.
|
今後の研究の推進方策 |
全胞状奇胎のDNAよりライブラリを作製し超並列型シークエンサーを用いてシークエンスする.イルミナ社のMiSeqによるシークエンスを想定しており,これはペアエンド法により両側250塩基読取を行った場合39時間反応を行うことで8ギガベース程度の塩基を読み取り可能な性能をもつ.全胞状奇胎のゲノムはハプロイドであることより通常の2倍体細胞より少ない読み取り深度でde novo アセンブルが可能であると考えており,まず8倍の条件を試してみるが,これは1サンプルあたりMiSeq 3ランに相当する.次にシークエンスの品質管理のためヒト参照配列コンソーシアムにより決定されている参照配列(GRCh37)にマッピングし,SNPを検出し,マイクロアレイ解析の結果と比較する.十分な品質であると判定されたらde novo アセンブリーを行う.これには「Cortex」(Iqbal et al., 2012)を利用する予定である.このソフトウエアは「colored de Bruijnグラフ」というアルゴリズムにより多検体を効率よくアセンブルするものである.配列決定後,GRCh37あるいは今後公開されるGRCh38と比較することにより新規構造多型を同定する.MiSeqによる読み取りではデータ量が不十分である場合はHiSeq2500を利用する可能性もある.
|
次年度の研究費の使用計画 |
当初の計画では超並列シークエンサーでの解析を受託解析により行う予定であったが,研究所に導入されたシークエンサーの利用を考えている.そのため研究費の支出は主にシークエンス試薬などの消耗品を予定している.データ解析は主に共同研究で行う予定であるが,外部のサーバーを利用した場合にその利用料金が必要となる可能性もある.また共同研究者との打ち合わせのために,国内旅費の使用を予定している.
|