2016 Fiscal Year Research-status Report
大規模ゲノムデータの相関構造を考慮した遺伝的予測モデリング
Project/Area Number |
16K00064
|
Research Institution | Kurume University |
Principal Investigator |
植木 優夫 久留米大学, 付置研究所, 准教授 (10515860)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 統計遺伝学 / 遺伝疫学 |
Outline of Annual Research Achievements |
近年、SNP(単一塩基多型)や次世代シークエンサーから得られる単一塩基バリアント(SNV)が安価に利用できるようになり、大規模ゲノムデータ解析の必要性が高まりつつある。 個人のゲノムデータから疾患発症をモデル化できる数学モデルが待望されているが、疾患発症に関与するバリアントはごく一部であり、多くの冗長な情報を含むスパースな超高次元データである。冗長なデータはノイズとして統計モデルの性能を大幅に低下させる。ゲノムワイド関連研究(GWAS)における標準手法である単点解析(つまり各バリアントを一つづつ検査する方法)は、統計遺伝学的解析において中心的な役割を果たしている。単点解析は、高次元小標本のデータであっても実施できる反面、各バリアントを独立として扱うために、バリアント間の相関構造を無視した解析となる。
この相関構造は連鎖不平衡によって生じており、大規模ゲノムデータにおいて相関構造が観察される。従来のゲノムワイド関連解析の研究計画は、独立な領域に単一の遺伝的要因が存在することを仮定していたが、複数の遺伝的要因が連鎖不平衡領域に存在する場合には、単点解析などの既存の遺伝的関連解析手法では検出が困難となる状況が起こりうることを、回帰モデルに基づく数理的解析を通じて見出した。このように遺伝的効果が隠される状況においても、遺伝的要因を検出するために、新たに、双方向グラフ上の最短経路を利用して検出を行う統計手法を開発した。得られた結果を論文として発表した(Ueki, Kawasaki and Tamiya 2017 Genet Epidemiol)。 また、Ueki and Tamiya (2016 Genet Epidemiol)にて開発したsmooth-threshold multivariate genetic preidction (STMGP)法をRパッケージstmgpに実装し、CRAN(The Comprehensive R Archive Network)に公開した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
新規に開発した統計手法を論文として発表した。統計手法を実装し、RパッケージstmgpをCRANにて一般公開した。
|
Strategy for Future Research Activity |
今後、開発した手法を実データに適用し、解析を行っていく。
|
Causes of Carryover |
当初予定していなかった海外出張を次年度に行うことになり、予算を確保する必要があった。
|
Expenditure Plan for Carryover Budget |
海外出張旅費に利用する。
|
Remarks |
発表論文Ueki and Tamiya (2016)の統計手法を実装したRパッケージ
|
Research Products
(10 results)