研究課題
がんにおけるゲノム変異を解明するため、次世代シークエンサーで得られたデータを高速に解析するコンピュータパイプラインの構築を行った。全エクソン解析、RNAシークエンス解析、またそれらの結果を統合するプログラムを開発し、さまざまながん腫の変異リスト作成することができた。実際、作成した解析結果から疾患の原因遺伝子変異を見つけている。例えば、白血病患者への治療として実施された造血幹細胞移植後に発症する、移植ドナー細胞由来白血病の発症のメカニズムの解明に貢献した。全エクソン解析の場合、がんの腫瘍部検体と同一患者の正常部検体のペアを解析し、がん特有の変異(体細胞変異)を見つけることが主な目的であるが、稀に同一患者のペアとなっていない検体と考えられる場合が見られた。そのため、正しいペアかどうかのチェック機構を1000人ゲノムプロジェクトで登録されているSNP(Simple Nucleotide Polymorphism、一塩基多型)の変異率より算出し、サンプルの整合性確認を行った。これまで、431検体中7検体は同一患者由来のサンプルとは考え難いという結果であった。当初は単体のサーバ上で動作させていたパイプラインであったが、大規模解析と高速化への対応として、効率的に分散処理できるようにSun Grid Engine上で動作させられるようプログラムの移植を行った。使用コア数やプログラム自体の修正の影響もあるが、従来より数倍~数十倍の高速化を実現した。
すべて 2014
すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件)
Nat Commun.
巻: 5 ページ: 4770
10.1038/ncomms5770