Research Abstract |
昨年度に引き続き,haplotypeを推定する問題を扱った.前年度までに開発した集合演算に基づく推定方法を,一塩基多型(SNP)データだけでなく,コピー数多型(CNV)データに対しても行えるよう拡張し,これを英文論文に纏めて掲載された.また,この手法はデータが複雑な場合は依然計算量爆発を起こす可能性があるため,最悪ケースでの計算量が多項式時間となる保証のある推定手法を開発した.これは,統計力学分野で良く用いられる二体相互作用モデルを一般のK体相互作用モデルに拡張したもので,Kの値を大きくすればするほど推定精度が高まると同時に,計算量も増加する方法となっている.従って,許容できる最大の計算量からKの値を逆に見積もって推定を行うことが可能となった.これについても,英文論文に纏めたものが来年度掲載される予定である. 連鎖不平衡(LD)指標に関する研究は,前年度までで隠れMarkovモデルを構築し,EMアルゴリズムによる解法を開発していたが,これに,モデルに関しては自由度を更に増やしてモデル選択の要素を加え,解法に関しては,遺伝的アルゴリズムの適用を行った.これにより,交叉ホットスポット部位の推定に関しては良い解を求めることに成功したが,交叉率の量的推定についてはまだ満足な結果が得られていない.遺伝的アルゴリズムは実装方法にかなりの自由度があるため,実装細部の調整が今後の課題として残った. これら以外に情報統計力学的な課題については,自己相関型連想記憶モデルの解析について,永田賢二氏,岡田真人教授,福島孝治准教授との共同研究により,4回の国内学会発表を行った.また,低密度パリティ検査符号(LDPC)についての新しい解法について,樺島祥介教授との共同研究により英文論文が掲載された.
|