2006 Fiscal Year Annual Research Report
個別化医療の実現に向けた情報統計力学的理論構築及び手法開発
Project/Area Number |
18079012
|
Research Institution | Waseda University |
Principal Investigator |
井上 真郷 早稲田大学, 理工学術院, 講師 (70376953)
|
Keywords | ゲノム多様性 / ゲノム情報処理 / バイオインフォマティクス / 確率的情報処理 / 統計的推測 / ゲノムデータベース / 遺伝診断学 |
Research Abstract |
一塩基多型(SNP)データより,haplotypeを推定する問題を扱い,従来手法の適用限界を大幅に改善した.今後更に細部を詰める必要があると思われる. haplotype推定とは,個別化医療で欠くべからざる基礎情報処理技術の一つである.従来,このhaplotype推定にはEMアルゴリズムを用いる推定手法が定番であったが,この方法は精度は良いものの,SNP部位数が24箇所程度までがメモリの許す限界で,それ以上の部位数は扱うことが出来なかった.一方,SNPデータはDNA microarray技術の進歩により年々多数の部位について簡便に測定を行うことが可能となっており,更なる推定手法が望まれていた. 今回開発した手法は全く近似を使わずに,従来のEMアルゴリズムと同等の推定を可能とするもので,実データでも約40箇所,約750固体のデータの解析に成功した.基本となるアイデアは,従来haplotypeの可能性数が2の指数乗に増加していたものを,可能性の同等なhaplotype同士をグルーピングすることで抑制するというもので,データの統計的性質から,殆どのケースで大幅な改善が見込める.また,原データ中に観測に失敗したデータが含まれていると可能性数が更に増加するが,これについても有効に抑制することに成功した.開発した手法の大部分はアルゴリズムが占めており,今後細部を詳細に検討することで更にメモリ必要量や計算量を改善できる可能性が十分あると思われる.データに観測失敗を含まない場合の推定手法については,本領域の平成18年度研究成果発表会にて発表を行った. これ以外に,情報統計力学的な課題について低密度パリティ検査符号及び画像修復などの課題に取り組み,それぞれ論文発表及び学会発表を行った.
|
Research Products
(1 results)