2020 Fiscal Year Annual Research Report
次世代シークエンス技術と機械学習を用いた、心房細動の精密化医療実現のための研究
Project/Area Number |
20J01343
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
宮澤 一雄 国立研究開発法人理化学研究所, 生命医科学研究センター, 特別研究員(PD)
|
Project Period (FY) |
2020-04-24 – 2023-03-31
|
Keywords | ゲノムワイド関連解析 / 心房細動 |
Outline of Annual Research Achievements |
本研究の初年度で行った内容は、解析に用いるデータセットの構築とそれを用いた疾患関連解析であった。データセットに関して、理化学研究所生命医科学研究センターに保管されている約20万人のバイオバンクジャパンのデータから、本研究で取り扱う心房細動のサンプルと比較を行うためのコントロールのサンプルデータを抽出した。疾患との関連を調べるゲノムワイド関連解析を行うにあたり、サンプルデータのクオリティーチェックを行って、最終的に9,826 人の心房細動のケースと140,446 人のコントロールを対象に解析を進めることとした。次に、解析で用いるジェノタイピングデータの情報量(解像度)を向上させるため、ジェノタイピングされていない欠損データを、外部のシークエンスデータを利用して統計学的に推測し補完するインピュテーションの方法を実施した。これにより、アレル頻度が1%未満の遺伝子多型(バリアント)を含めた16,817,144のバリアントデータを構築することができた。このようにして得られたデータセットを用いて心房細動のケースとコントロールサンプルでゲノムワイド関連解析を実施した。結果は、心房細動の発症と関連する31の疾患感受性領域を同定することができ、そのうち5つはこれまで報告のない新規の領域であった。これらの新規領域では、心筋症の患者で報告されているバリアントが含まれていた。さらに、バイオバンクジャパンのデータに加えて、ヨーロッパ人のゲノムワイド関連解析の結果と統合したメタ解析も行った。その結果、同定した疾患感受性領域は150まで増やすことができた。同定された領域内のバリアントは、心臓の発生や発達に関連する遺伝子、また心筋組織の構造や収縮機構に関連する遺伝子に集積しており、これらの遺伝子は心臓の組織で特異的に発現していることも分かった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
初年度は、解析に用いるサンプルの抽出とそのゲノムデータの構築、さらにそのデータを用いた疾患関連解析を予定していた。特にサンプルの抽出とそのゲノムデータの構築は、その後の解析結果に大きな影響を与えるため、時間をかけて慎重に行なった。これに関しては、同様の解析を行なっている論文等を参考にして、さらに研究室内のメンバーや上司と結果の共有しディスカッションを重ねた。約半年ほどのデータチェックを行い、最終的に解析に適したデータセットの構築が行えた。そして、このデータセットを用いて疾患とゲノムの関連解析へと進むことができた。得られたゲノムデータと疾患との関連を調べたゲノムワイド関連解析では、すでに疾患との関連が報告されている疾患感受性領域の同定ができており、解析結果に明らかなバイアスがないことを確認しており、これらはデータのクオリティーに問題がないことを示している。関連解析においては、非常に多くのデータ量を使用し、さらに非常に多くの計算を行う必要があるため、解析に必要な機器を購入している。またこれらの解析を行うにあたって、適切な解析ソフトウェアを選択し、またその結果の解釈についても研究室内のメンバーで十分検討した上で解析を進めている。現状では既存の報告に加えて、これまでに報告のない新規の疾患感受性領域も同定できていることから、同定した新規領域の機能解析へ進めることができ、初年度の計画から次年度へとつなげることができ、進捗状況としては研究計画通りに進んでいると考える。
|
Strategy for Future Research Activity |
初年度で得られた結果は、解析に用いるデータセットの構築に加えて、疾患と関連する疾患感受性領域の同定が主であった。しかし、領域内にある遺伝子多型(バリアント)は全てが疾患と関連しているわけではないため、次年度ではそれらのバリアントの機能を明らかにし、疾患との詳細な関係を調べていく。実際にこれまでの報告でも心房細動と関連するバリアントは遺伝子を直接コードしないノンコーディング領域に多く集積していることが知られているため、これらのバリアントは遺伝子発現の調節に関わる転写因子に影響を与えることが示唆される。そこで、遺伝子発現に関する公共のデータベースを利用して、各バリアントがどの転写因子に関与するかを調べていく。それにより、同定されたバリアントの中で、どのバリアントが疾患発症に重要であるかを評価する。これに関しては、共同研究機関でのデータベースも利用し、より詳細な機能解析を行なっていく。そのため、共同研究機関とデータの共有を行い、慎重にディスカッションを重ねていく予定である。さらに、近年ゲノムワイド関連解析の研究で注目されているポリジェニックリスクスコアについても調べていく。ポリジェニックリスクスコアはゲノムワイド関連解析の結果を利用して算出され、疾患の発症予測に有用であることが知られている。さらにバイオバンクジャパンでは心房細動に関連する臨床アウトカム(心不全や脳梗塞など)の経時的データもあるため、これらのデータとポリジェニックスコアの関連についても同様に調べていく予定である。
|
Research Products
(2 results)