研究課題/領域番号 |
20K15773
|
研究機関 | 東京大学 |
研究代表者 |
小井土 大 東京大学, 医科学研究所, 特任助教 (40787561)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | ディープラーニング / ゲノム解析 / エピスタシス |
研究実績の概要 |
遺伝因子の組合せ効果(エピスタシス効果)の同定は遺伝統計学が古くより探求してきた問いであるが、古典的統計学の手法では多重検定と計算量の問題に直面す る。本研究では、疾患感受性多型の発現制御領域への集積に着目し、(1)臓器・細胞別の転写制御に対するエピスタシス効果を高精度・網羅的に得て、(2)それらと多因子疾患との関連を日欧バイオバンクの遺伝統計解析から検証する。特に(1)を達成するためのツールとして、臓器・細胞種別の発現制御モチーフ配列を数十kbのゲノム配列パターンから学習した機械学習モデルの高速化に昨年度成功した(DeepSEA Belugaの重みのうち83%を削減しつつ、精度を維持)。一方で、エピスタシス効果を考えるにあたり発現制御領域に着目する端緒となった論文(Hemani et al. Nature 2014; 2021年に撤回)の著者らの追加解析によって、原因多型の相加効果が大きい時に不完全な連鎖不平衡にあるタグSNPをエピスタシス効果の評価に用いると統計量がインフレーションし、誤発見につながることが示された(Hemani et al. Nature 2021)。このことから、機械学習による多型の予測効果が原因多型についてのピンポイント予測でないと、遺伝統計解析による妥当性評価が困難であることが明らかとなり、ピンポイント予測に関する精度評価が急務となった。そのために今年度はin silico変異導入法による予測活性の精度検証について重点的に行い、実験的評価や統計的ファインマッピング結果が様々な形質について存在する相加的効果を用いて申請者の開発した機械学習法の精度評価を行い、他の従来法よりも特異性の高いピンポイントな予測ができていることなどを明らかにした。これらの評価を含む研究論文は、2022年1月に国際科学誌にて原則的採択となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2021年度では「設定課題2.cis-eQTLのエピスタシス効果の探索」や「設定課題3. trans-eQTLのエピスタシス効果の探索」について、申請者が開発した「転写物周辺±100 kbのゲノム配列からmRNA・ 非翻訳RNAの細胞種別転写を予測するゲノミクスAI」(M Koido et al. bioRxiv 2020)をベースとしつつ、2020年度に開発したモデル軽量化法を応用してさらに改良する計画であった。しかし、eQTLのエピスタシス効果の先行研究論文(Hemani et al. Nature 2014)が2021年に撤回され、同じ著者らの追加解析によって原因多型の相加効果が大きい時に不完全な連鎖不平衡にあるタグSNPをエピスタシス効果の評価に用いると統計量がインフレーションすることが示された(Hemani et al. Nature 2021)。この先行研究の撤回は申請者が目指すeQTLのエピスタシス効果の存在を否定するものではない。しかし、eQTLのエピスタシス効果の予測値を介して疾患等のエピスタシス効果を遺伝統計解析によって探索する際も、エピスタシス効果の予測値が連鎖不平衡に依存しない結果である必要が明らかとなった。そこで2021年度はin silico変異導入法による予測活性の精度検証について重点的に行い、実験的評価や統計的ファインマッピング結果との比較検討から、申請者の開発した機械学習法(MENTR)が他の従来法(Basenjiなど)よりも特異性の高いピンポイントな予測であり、高精度な予測が実現できていることなどを明らかにした。以上より、当初の計画よりもやや遅れたものの、疾患に関連するエピスタシス効果を見つけるためには必要な回り道であったと考えている。
|
今後の研究の推進方策 |
本研究は3年間にわたる計画である。2年目となる2021年度では「設定課題2.cis-eQTLのエピスタシス効果の探索」や「設定課題3. trans-eQTLのエピスタシス効果の探索」を計画していたが、上述した理由による急務の検討を優先的に実施したことにより、当初の計画よりもやや遅れることとなった。しかしながら、先行研究(Hemani et al. Nature 2021)により生じた懸念については申請者が考案する機械学習を用いたアプローチを用いる方向性で問題ないことが確認され、本設定課題を遺伝統計解析へと展開する論理が成立することを示せた。 2022年度においては、2021年度に開発したゲノム配列の機械学習高速化技術を実際に用いてMENTR(申請者独自の機械学習法, 国際科学誌にて2022年1月に原則採択)を高速化し、cis-eQTLおよびtrans-eQTLのエピスタシス効果を探索する。それら予測値の十分高いeQTLのエピスタシス効果を示した多型の組合せについて、疾患との関連解析へと進める予定である。
|
次年度使用額が生じた理由 |
コロナ禍により、旅費を使用する予定であった国内学会・国際学会などがすべてオンライン開催になるなどし、予定とのズレが生じた。本繰越額については、当初の研究目的を達成するために効果的に研究を行うべく、AI橋渡しクラウド(産総研スパコン)の利用料金などの演算必要な経費としての使用を予定している。
|