研究領域 | パーソナルゲノム情報に基づく脳疾患メカニズムの解明 |
研究課題/領域番号 |
22129008
|
研究機関 | 東京大学 |
研究代表者 |
森下 真一 東京大学, 大学院・新領域創成科学研究科, 教授 (90292854)
|
研究分担者 |
笠原 雅弘 東京大学, 大学院・新領域創成科学研究科, 講師 (60376605)
|
キーワード | ゲノム / アルゴリズム / ソフトウエア |
研究概要 |
ヒトゲノムの多様性には大きく分けて、1塩基置換(SNP)/短い挿入削除等のミクロな多様性、大規模な脆弱領域/染色体内逆位/染色体の融合転座等のマクロな多様性がある。ヒトゲノム全域にわたって多様性情報を収集し分類することは人類遺伝学の大きな目標であるが、その情報量の大きさゆえに効率的に観測・分類を行うことは困難であった。超高速DNA解読装置の登場は、疾患関連遺伝子座の状態を、1塩基対レベルで観測することを可能にした。この結果、稀な変異が多様に起こり発症すると考える仮説の検証を可能にしつつある。本研究では、これまでの研究でゲノムと疾患の相関について先駆的研究が展開されてきた脳疾患を対象に、個人ゲノム情報を収集し、疾患と相関の高い多様性モチーフを探し出し、モチーフが生まれる機序を推定する新しい情報学を創成することを目指している。 平成23年度は挿入削除、逆位、染色体融合等の構造多型を精度よく検出することに取り組んだ。これらの変異が起こっているゲノム上の位置を精度良く推定するために、split alignmentアルゴリズムを作成した。また、挿入欠失部位の周辺ではアラインメントの誤りに起因する擬陽性の多型が検出される例が多いことが分かっているが、この問題に対処をするために生リードを直接アラインメントするのではなく軽くアセンブリを行いリードを擬似的に伸ばした後にアラインメントを行うことで擬陽性を大きく減らすアルゴリズムを開発した。また、PacBio RSが導入され、長いリードが収集可能になった。PacBioリードには塩基レベルで10%を超える挿入削除エラーが含まれる。この補正のため、Illuminaリードとのマッチングを取る高精度かつ高速なアルゴリズムを研究開発した。一方で、個人固有のde novo insertionのカタログ化を進めている。また、400 alleleの情報を基に、日本人の標準的なゲノムを決定した。これにより日本人内ゲノム多様性のプロファイリングは格段に進歩すると期待できる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
アルゴリズムの研究開発は概ね順調に進んでいる。日本人標準ゲノムおよび多様性のプロファイリングは、当初の計画より若干遅れ気味であったが、新しい高性能シーケンサーの導入により、計画に追いつくことができた。
|
今後の研究の推進方策 |
構造多型の検出アルゴリズムの研究開発では、平成24年度も引き続き精度の向上を目指す。またPacBio sequencerの導入により、個人固有のde novo insertionのカタログ化を継続する。日本人レファレンスゲノムの作成については、1000 alleleまで拡張する。またde novo insertionの情報も順次追加する。
|