研究実績の概要 |
本研究の対象は、うつ病で、特に、insomnia-hypersomniaと呼ばれる対の症状に着目し、その背景にある生命科学のメカニズムを、データベースと、データからの機械学習により解明することを目的としている。一昨年度に、解明に必要なデータベースを整備した。具体的には、臨床コホートデータとして定評のある、UKバイオバンクの50万件ほどの個人データから幅広いデータを抽出し、各個人の遺伝情報と環境情報をデータとして整備した。昨年度は、このデータを入力とする機械学習手法のモデル設計・構築に取り組んだ。入力となるUK Biobankの個人データは50万件ほどに達するため非常に大規模で、モデル設計後の実装においては、モデルのみならず学習手法の効率化に取り組む必要があった。モデルは、入力として遺伝情報のみならず環境情報をも入力とする深層学習手法であり、実装後、モデルの有効性を検証しつつ、モデル及び学習手法の改良を行った。このモデル学習は、以下の特徴を有する:1,50万件にも及び大規模個人データが入力可能である、2, 遺伝情報及び環境情報をも入力する、3, 学習後のモデルからデータの内容を説明可能な、いわゆるExplainable AIの機能を考慮することにより、メカニズム解明が可能である。本年度は、このモデルを実際の大規模データに適用し、結果を解析することにより、様々な知見を得た。本年度の成果は、1,このような特徴を持つデータ解析手法の適用は新しく、既存手法を凌駕する予測性能を挙げた。2,適用結果の解析から、うつ病や関係する病状の発症に関連する遺伝子やパスウェイ等の情報が得られた。以上の成果は、今後、複数の論文としてまとめ、出版する予定である。
|