遺伝因子の組合せ効果(エピスタシス効果)の同定は、遺伝統計学の長年の課題である。本研究では、疾患感受性多型の発現制御領域への集積に着目し、DNA配列から遺伝子発現を臓器・細胞別に予測する手法(MENTR)の開発を通じ、遺伝統計解析の進展を目指した。最終年度では、MENTRの第一ステップで使用する高速化機械学習モデル(軽量化モデル)について、学習量を増加して予測精度の最大化を試みた。その結果、条件検討時には大差なかったものの、最終的には高速化モデルの予測精度が通常のモデルに比べて若干劣った。これらの独自モデルをMENTRの第一ステップに組み込み、エピスタシス効果を考慮したin silico変異導入解析を高速に実施するため、コーディング作業を進めた。研究期間全体を通じて、MENTRの高速化に加えて、MENTRの予測根拠の解釈法を開発し、転写開始点から遠方のエピジェネティックな状態が二つ以上組み合わさった際の非線形な効果の考慮が、非翻訳RNAの予測能の向上に重要であることを明らかにした。この結果は、遠方のエピスタシス効果を前提として非翻訳RNAの発現予測がされていることを示唆する。また、MENTRを用いて、世界中で様々な形質に対して実施されてきたゲノムワイド関連解析(GWAS)から得られた感受性多型のin silico変異導入解析を行い、それらの形質に関連する非翻訳RNAを1万種以上をカタログ化し、公開した。非常に稀な多型が非翻訳RNAを介して喘息などの疾患発症に影響する機序を明らかにし、2023年11月に国際科学誌Nat Biomed Eng誌に公開した。また、MENTRを活用して、脳梗塞(Nature. 2022)や後縦靱帯骨化症(Am. J. Hum. Genet. 2022)などの疾患感受性多型のin silico変異導入解析を行い、GWAS結果の生物学的解釈に貢献した。
|