Research Abstract |
従来より稀な原因を狙ってゲノムワイド関連解析を行うため,ピーク検出アルゴリズムと,ブートストラップ法による帰無分布の取得方法を考慮したKolmogorov-Smirnovの検定法を用いたホモ接合体マッピングに基づく手法を開発した(リバイス論文投稿中).次に,複数の遺伝子の相互作用によるゲノムワイド関連解析ツールを開発した.これには,モデルベースによって全組合せの尤度を求める方法と,ロジスティック回帰分析を基本としpermutation testによる帰無分布をimportance samplingによって高速化した関連解析手法を用いる方法との2種類の実装を行い,並列化した.そしてコピー数多型や変異の解析のためのハプロタイプフェージング手法を,SNPを含む複雑な場合も解決できるEM-PLアルゴリズムで開発し,具体例として,全ゲノム中でのSNPとの連鎖不平衡の関係という,原因探索に重要な問いに答えた.そして次世代シークエンサーデータ解析には,高精度なマッピング,ベイズ推定や尤度比検定によるSNVコール,ペアエンド/メイトペア間の距離とリードの深さの組合せによるコピー数多型/変異や,ペアエンド/メイトペア間の距離や向きによりゲノム再編成の特定を行うアルゴリズムを,それぞれ開発した.またアセンブルソフトにより新規配列を同定する解析手法を確立した.これらをまとめて並列パイプライン化し,世界初の日本人ゲノムの多様性の包括的解析として報告を行った.そしてこれらの手法を国際がんゲノムコンソーシアムのデータに適用し,変異のカタログを報告した.現在,同手法を,より多くのサンプルに適用中である.また次世代シークエンサーとタイリングアレーによる転写発現データを比較し,特性の比較を行い,メリットとデメリットを報告した.
|