2022 Fiscal Year Annual Research Report
Systems pathology approach using deep learning to understand the effect of environmental exposure on the pathogenesis of common diseases
Project/Area Number |
21H03537
|
Research Institution | Tohoku University |
Principal Investigator |
荻島 創一 東北大学, 未来型医療創成センター, 教授 (40447496)
|
Co-Investigator(Kenkyū-buntansha) |
川島 秀一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (50314274)
宮下 哲典 新潟大学, 脳研究所, 准教授 (60323995)
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任教授 (60396869)
鎌田 真由美 京都大学, 医学研究科, 准教授 (70749077)
小島 諒介 京都大学, 医学研究科, 講師 (70807651)
水野 聖士 東北大学, 東北メディカル・メガバンク機構, 助教 (80646795)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | アルツハイマー病 / 疾患アトラクター / 生命情報 / システム生物 / 深層学習 / 機械学習 / 遺伝子・環境相互作用 / 多因子疾患の発症機序 |
Outline of Annual Research Achievements |
令和3年度に構築した知識グラフを用いて、グラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を開発した。 臨床表現型、環境要因、検査値・分子濃度、遺伝要因のノードから構成される知識グラフを用いて、リンクに意味関係をもたせた知識グラフネ ットワークを構築した。このグラフネットワークの臨床表現型、環境要因、検査値・分子濃度、遺伝要因の各ノードの特徴量ベクトルとして、 アルツハイマー病の患者群のデータ、対照群のデータを用いることとした。このとき必ずしも知識グラフで定義されていない臨床表現型、環境要因、検査値・分子濃度、遺伝要因も孤立ノードとしてデータを用いることとした。Graph Convolutional Network (GCN) として、Graph Autoencoder Modelを用いて、これらの特徴量ベクトルから孤立ノードと既存のノードとのリンク予測を行う方法を開発した。このとき、生命科学のデータ用にグラフベースの深層学習のパッケージkGCN (a graph-ba sed deep learning framework for life science) (https://github.com/clinfo/kGCN) をベースに開発した。これによ り、アルツハイマー病の発症に関連する未知の環境要因、遺伝要因、遺伝要因と環境要因の相互作用を同定する方法とした。 また、個々人のデータに対して、GCNにより、畳み込み層、プーリング層、集約層を経て、個々人の特徴ベクトルを出力する方法を開発した。 この特徴ベクトルをアルツハイマー病のプロファイルとして、正常、未病、アルツハイマー病の判別ができるように最適化する方法を開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和3年度に構築した知識グラフを用いて、グラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を開発した。当初の想定に反し、構築した知識グラフネットワークが膨大かつ複雑であることにより 、準備したGCNの深層学習の実施条件とGPGPUでは深層学習の実施が困難であることが判明したが、臨床表現型、環境要因、検査値・分子濃度、遺伝要因のノードから構成される知識グラフを用いて、リンクに意味関係をもたせた知識グラフネ ットワークを再構築し、このグラフネットワークの臨床表現型、環境要因、検査値・分子濃度、遺伝要因の各ノードの特徴量ベクトルとして、 アルツハイマー病の患者群のデータ、対照群のデータを用いるものとして、Graph Autoencoder Modelによりこれらの特徴量ベクトルから孤立ノードと既存のノードとのリンク予測について、深層学習の実施条件の再検討、高速化したGPGPUの導入によるGCNの再解析を実施して、順調に進展した。
|
Strategy for Future Research Activity |
令和3年度に構築した知識グラフを用いて、令和4年度に開発したグラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を用いて、アルツハイマー病の発症に関連する未知の環境要因、遺伝要因と環境要因の相互作用を同定する。環境曝露としては、飲酒、喫煙、運動、ストレス、仕事、人とのつながりについての項目、検査値としては血液・尿検査の数十の項目、遺伝要因としてはSNPアレイによる数万のバリアントを用いる。得られた遺伝要因と環境要因の相互作用を説明変数間の積の項として、ロジスティッ ク回帰分析に導入することにより、アルツハイマー病の判別精度が高まるかどうかを検証する。これにより同定された遺伝要因と環境要因の相 互作用が確からしいものかを検証する。また、個々人のデータを用いて特徴ベクトルを出力し、この特徴ベクトルをアルツハイマー病のプロフ ァイルとして、正常、未病、アルツハイマー病を判別する。 さらに、患者群、未病、対照群の個々人のデータについて、これらの群を判別す るような特徴量を定義し、その特徴量空間においてポピュレーショングラフを定義する。定義したポピュレーショングラフについて、GCNによ り、畳み込み層、プーリング層、集約層を経て、患者群、未病、対照群の特徴ベクトルを出力する。 この特徴ベクトルを特徴量に用いて、特徴量空間上に、アルツハイマー病の疾患状態を定義し、遺伝要因と環境要因の変動による安定性への影響、生活改善によるリスク低減について評価する。
|
Research Products
(85 results)