近年のシークエンシング技術の発展に伴い、大量の遺伝子型情報を高速に入手することが可能となりつつある。しかしながら、一般的な疾患の原因因子の特定は当初期待されていたほど進んでいないというのが現状である。一つの原因と考えられているのが、従来のモデルは基本的に一カ所の遺伝子型に基づいており、単純すぎるからというものである。そこで、本研究では複数の遺伝子型、さらには表現型に基づいた表現型(疾患)モデルを仮定し、原因因子の特定を行う。本研究におけるチャレンジは主に2つに分けられる。 1)原因因子の組み合わせの空間が膨大となること 2)組み合わせ因子の評価を行う際の多重検定問題 1)については、多項式カーネルとモデル選択を併せた手法の提案を行った。計算機実験及び実データにおいて良好な結果を得ており、国際学会 Genome Informatics Workshop (GIW) 2016で発表するとともに、国際誌 Journal of Bioinformatics and Computational BIology (JBCB) に受理、掲載されている。また、マルチプルカーネルラーニングを用いた組み合わせ次数の推定法を提案し、実装してみたところ、計算機実験において良好な結果を得ている。 2)については、Taroneの補正法のWald検定への拡張を行った。計算機実験において良好な実験結果を得ており、国内の研究会で発表するとともに、国際学会への投稿を準備中である。
|