2012 Fiscal Year Annual Research Report
Exploring informatics for brain diseases based on personal genomics
Project Area | Personal genome-based initiatives toward understanding bran diseases |
Project/Area Number |
22129008
|
Research Institution | The University of Tokyo |
Principal Investigator |
森下 真一 東京大学, 新領域創成科学研究科, 教授 (90292854)
|
Co-Investigator(Kenkyū-buntansha) |
笠原 雅弘 東京大学, 新領域創成科学研究科, 講師 (60376605)
|
Project Period (FY) |
2010-04-01 – 2015-03-31
|
Keywords | ゲノム / アルゴリズム / ソフトウエア |
Outline of Annual Research Achievements |
本研究では、これまでの研究でゲノムと疾患の相関について先駆的研究が展開されてきた脳疾患を対象に、個人ゲノム情報を収集し、疾患と相関の高い多様性モチーフを探し出し、モチーフが生まれる機序を推定する新しい情報学を創成することを目指している。
平成24年度は、short tandem repeat と呼ばれる長さが 2-6 塩基のユニットが繰り返し異常な長さ(典型的には 1000塩基以上)に伸長する現象を個人ゲノムの中に見出すためのアルゴリズムを設計した。特に工夫したのは、第二世代のシーケンサーが出力する長さ100塩基前後の短い配列を利用して、長い short tandem repeat の存在を予測することである。10-20億本の短い配列を高速に処理するために様々な最適化技術を取り入れる必要があったが、1日以下程度で処理することが可能になった。この予測により、長い short tandem repeat が存在するゲノム上の位置までを推定できるようになったが、内部を完全解読するのは困難であった。幸い、位置情報が得られるため short tandem repeat 周辺の配列を使って PCR 増幅できる場合は増幅し、長い配列を解読可能な Pacific Biosciences 社の RS シーケンサーにより解読ができるか否かを、SCA31 をサンプルとして検証した。その結果、いままでは中身を解読できていなかった short tandem repeat を完全解読できるようになった。この方法を様々な脳疾患のゲノム解析に適用しつつある。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
平成23年度までにパーソナルゲノム内の SNV や短い挿入削除配列を同定する技術の研究開発を終え、実際のデータ解析が計画通りに順調に進行している。一方、構造多型検出についても長い削除や逆位については検出できるようになってきていたが short tandem repeat は難問であった。しかし平成24年度には解決の見通しが立ち、様々な疾患ゲノムの解析へと展開することができた。
|
Strategy for Future Research Activity |
当初の計画を超えて研究は順調に進行している。平成25年度には長い新規配列および長いコピー数多型を検出するための技術開発に取り組む。
|