初年度は、2型糖尿病における疾患関連遺伝因子と疾患関連環境因子の複雑な相互作用であるゲノム環境ワイド関連解析GE-WAS(Gene-Environment-Wide-Association-Study)について、解析プログラムの開発や方法論の検討を行った。具体的には、疾患関連遺伝因子・疾患関連環境因子・表現型(罹患歴)の3種類の組み合わせを用いて、Cochran-Mantel-Haenszelカイニ乗検定により得られたP値でGxEランドスケーププロットを描画した。 2年目では、GE-WAS解析プログラムの改良、GE-WAS解析に用いる表現型の定義の検討とルールベースのフェノタイピングアルゴリズム、高次元データの次元圧縮方法について検討を行った。表現型として使用した既往歴は、自己申告の調査票に記載されたものであり、研究として利用できる普遍的な表現型を、電子カルテ情報、検体検査値、投薬情報などから決定するフェノタイピング手法について検討した。 最終年度には、開発したGE-WAS用解析プログラムをソフトウェア開発のプラットフォームであるGitHubにて公開し、今後も継続して開発できる環境を構築した。またGE-WASで重要な表現型の同定を行うために、2型糖尿病のフェノタイピングアルゴリズムの作成を行った。疫学レセプトデータベースであるJMDC Claims Databaseを用いて、複数の健康保険組合より寄せられたレセプト(入院、外来、調剤)および健診データの中から、2型糖尿病の病型分類に必要な検体検査値(グルコース、グリコアルブミン、HbA1c)、投薬情報(PMDAにて承認された処方薬のうち、添付文書の効能・効果に「糖尿病」と記載あり)、レセプト病名(ICD10コード:E10-E14)を用いて、ルールベースのアルゴリズムを作成した。
|