研究概要 |
外れ値の割合が小さい場合に対処するための方法論や理論は,これまでにかなり整理されていた.ところが,外れ値の割合が大きい場合には,幾つかの方法論や理論はあるものの,本来の目的である潜在的なバイアスを小さくする,ということを調べるための理論が整備されていなかった.研究代表者は,外れ値の割合が小さいか大きいかに関わらず,外れ値に対処するための理論を完成させた.そして,過去に提案されていた,ある方法が,その目的に適うことを示した.さらに,その目的に適う方法が,本質的に一つしかないことを証明した.これは画期的な結論だった.その論文がJournal of Multivariate Analysisに受理された. AffymetrixのGeneChip上のプローブにはSNPが混在しているときがある.そのとき,得られたデータをそのまま解析すると,SNPの影響で,思ったような結果が得られないことがある.そのようなSNPの影郷を外してデータを解析するためにはどうすればよいのか,という問題がある.これまでは,そのようなSNPに影響されているプローブを同定して,そのプローブの結果を使わないことにしてデータを解析すると言う二段階の解析が主流であった.本研究では,それらを同時に扱える方法を開発し,対応するソフトウェアSNEPを開発した.SNPに影響されているプローブから得られるデータを外れ値として考えることで,そのような目的を可能にした.特に,そのようなプローブの割合は小さいとはいえず,外れ値の割合が大きい場合として捉えられ,上述の方法論が見事にマッチした.
|