Research Abstract |
昨年度に引き続き,一塩基多型(SNP)データよりhaplotypeを推定する問題を扱い,従来手法の適用限界を大幅に改善した.アルゴリズムの細部を詰め,現在フリーソフトとして公開している.また,英文論文を投稿中である. 今年度はhaplotype blockの区切り(組換hot spot)をSNPデータから推定する研究を主に行った.これは,連鎖不平衡(LD)指標とも呼ばれ古くから研究されているが,未だに複数の指標値を人間が総合的に判断するという主観的な方法が主流であり,問題となっている.この問題を突き詰めたところ,これは「独立性の検定」と極めて類似度の高い問題であり,更に,「独立性の検定」自体が計算量を削減するために様々な近似が導入されたバリエーションが多数存在する,学問的に整理されていない分野であることが分かった.具体的には,医学,生物分野で極めてよく用いられるカイ二乗検定は近似で歪められた検定であり,十分な計算機資源がある現在では使うべきでない検定であるとの結論に至った. また,組換hot spot推定について,尤度比検定,相互情報量に基づく新たな指標を開発した.haplotype推定されたデータであれば,この手法は従来手法に比べて正しく組換hot spotを推定できた.しかしながら,本来はhaplotype推定されていないデータから推定を行わなければならないこと,また開発手法の厳密な妥当性が証明できていないこと,の二点が主要な問題として依然残っている. これら以外に情報統計力学的な課題について,一次視覚野をGaborフィルタで摸し,一次視覚野の脳計測データから視覚画像を逆推定するという課題や,適応的自然勾配法を特異モデルにおいても使えるようにする手法の開発,低密度パリティ検査符号(LDPC)の可視化などの課題に取り組み,学会発表等を行った.
|