現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
該当年度は、データベースとSVMを利用した線形&非線形分離パターンのバイオマーカーの探索において、使用するデータの選別とデータフィルタリングが目標であった。データの選別はIC値の実験データから、信頼性の高い9個に絞ることができた。アノテーション情報の作成については、illumina社が提供するDNAメチル化ビーズアレーinfiniumのアノテーション情報がヒトゲノムhg19バージョンであることから、最新のhg38に相当するアノテーション(ref.1)を公開大規模データベースTCGAから取得した。さらにCpG islandについては、長さ1kb以上のものについてはsub idを作成し、距離を考慮した独自のCpG island のIDを作成した。アノテーション付加を行うスクリプトも作成できた。データフィルタリングにおいて、サンプルのメチル化度合いを評価することが必要であった。そのため、TCGAの大規模データを用いて、プローブ毎のメチル化値の分散や平均値などを調べ、メチル化値の分散を用いる評価基準を定めた。この基準を用いて、候補ターゲットのフィルタリングが出来た。よって、おおむね順調に進展している。 [1]. Zhou, Wanding, Laird Peter L., and Hui Shen. "Comprehensive characterization, annotation and innovative use of Infinium DNA methylation BeadChip probes." Nucleic Acids Research. (2016): doi: 10.1093/nar/gkw967
|