ヒトゲノム情報解析を組合せ最適化問題として再解釈する研究について、異分野をつなぐ学際的研究活動を通じて実装を進めた。最適化理論は、ある制約のもとで最も良い解を見つけるための数理科学方法論として開発されてきた。情報科学や都市・金融工学など多彩なリアルワールドデータへの応用研究が盛んである。特に、グラフなど組合せ的な構造を持つ最適化問題に対しては、数理的構造に着目した効率的なアルゴリズム設計がなされてきた。ヒトゲノム領域全域に分布する多数の遺伝子変異情報を個人のジェノタイプ情報に基づき統合して疾患発症リスクを推定留守Polygenic Risk Score(PRS)は、ゲノム個別化医療社会実装の鍵として注目されている。ゲノムワイド関連解析(GWAS)を通じて得られるゲノムワイド関連統計量に基づくPRS推定を題材として、最適化理論を活用した予測精度の向上に関する解析を実施した。サンプルの収集とゲノムデータ構築を実施し、解析対象とした。PRS計算アルゴリズムにおいては、一定の有意水準で遺伝子変異を抽出した上で、連鎖不平衡関係(linkage disequilibrium; LD)を考慮してスコア計算の対象遺伝子変異を抽出するClumping-Threshold法が主流であった。本研究を通じて日本人集団のゲノム・臨床情報を対象に様々な手法を用いてPRSを計算したところ、ベイズ推定など基づき領域内のLD構造を最適化した上で対象遺伝子変異を抽出する手法群においてPRS予測精度の向上が認められることが明らかになった。更に、ヒト白血球型抗原(human leukocyte antigen; HLA)などヒトゲノム配列上で複雑なゲノム構造を有する領域については、最適化理論を活用したハプロタイプ構造の推定と、ハプロタイプに基づく疾患リスク推定が有用なことを示した。
|