Project/Area Number |
21H03537
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Tohoku University |
Principal Investigator |
荻島 創一 東北大学, 未来型医療創成センター, 教授 (40447496)
|
Co-Investigator(Kenkyū-buntansha) |
川島 秀一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (50314274)
宮下 哲典 新潟大学, 脳研究所, 准教授 (60323995)
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (60396869)
鎌田 真由美 京都大学, 医学研究科, 准教授 (70749077)
小島 諒介 京都大学, 医学研究科, 講師 (70807651)
水野 聖士 東北大学, 東北メディカル・メガバンク機構, 助教 (80646795)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2023: ¥5,070,000 (Direct Cost: ¥3,900,000、Indirect Cost: ¥1,170,000)
Fiscal Year 2022: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2021: ¥7,800,000 (Direct Cost: ¥6,000,000、Indirect Cost: ¥1,800,000)
|
Keywords | 多因子疾患の発症機序 / 遺伝子・環境相互作用 / アルツハイマー病 / 機械学習 / 深層学習 / 疾患アトラクター / 生命情報 / システム生物 |
Outline of Research at the Start |
多因子疾患として、アルツハイマー病の疾患発症に対する、環境曝露の影響や遺伝要因との相互作用について、深層学習を用いたシステム的解明に取り組む。環境要因、臨床表現型、遺伝要因の知識を収集して知識グラフを構築し、UKBiobankと新潟大学脳研究所のアルツハイマー病患者群および対照群のデータ、東北メディカル・メガバンク計画の対照群のデータを用い、深層学習の機械学習手法を開発する。アルツハイマー病の発症に関連する未知の環境要因、遺伝要因と環境要因の相互作用を解明し、個々人のデータに対する特徴ベクトルを、アルツハイマー病を判別するプロファイルとして最適化し、正常、未病、アルツハイマー病を判別する。
|
Outline of Annual Research Achievements |
令和3年度に構築した知識グラフを用いて、グラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を開発した。 臨床表現型、環境要因、検査値・分子濃度、遺伝要因のノードから構成される知識グラフを用いて、リンクに意味関係をもたせた知識グラフネ ットワークを構築した。このグラフネットワークの臨床表現型、環境要因、検査値・分子濃度、遺伝要因の各ノードの特徴量ベクトルとして、 アルツハイマー病の患者群のデータ、対照群のデータを用いることとした。このとき必ずしも知識グラフで定義されていない臨床表現型、環境要因、検査値・分子濃度、遺伝要因も孤立ノードとしてデータを用いることとした。Graph Convolutional Network (GCN) として、Graph Autoencoder Modelを用いて、これらの特徴量ベクトルから孤立ノードと既存のノードとのリンク予測を行う方法を開発した。このとき、生命科学のデータ用にグラフベースの深層学習のパッケージkGCN (a graph-ba sed deep learning framework for life science) (https://github.com/clinfo/kGCN) をベースに開発した。これによ り、アルツハイマー病の発症に関連する未知の環境要因、遺伝要因、遺伝要因と環境要因の相互作用を同定する方法とした。 また、個々人のデータに対して、GCNにより、畳み込み層、プーリング層、集約層を経て、個々人の特徴ベクトルを出力する方法を開発した。 この特徴ベクトルをアルツハイマー病のプロファイルとして、正常、未病、アルツハイマー病の判別ができるように最適化する方法を開発した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和3年度に構築した知識グラフを用いて、グラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を開発した。当初の想定に反し、構築した知識グラフネットワークが膨大かつ複雑であることにより 、準備したGCNの深層学習の実施条件とGPGPUでは深層学習の実施が困難であることが判明したが、臨床表現型、環境要因、検査値・分子濃度、遺伝要因のノードから構成される知識グラフを用いて、リンクに意味関係をもたせた知識グラフネ ットワークを再構築し、このグラフネットワークの臨床表現型、環境要因、検査値・分子濃度、遺伝要因の各ノードの特徴量ベクトルとして、 アルツハイマー病の患者群のデータ、対照群のデータを用いるものとして、Graph Autoencoder Modelによりこれらの特徴量ベクトルから孤立ノードと既存のノードとのリンク予測について、深層学習の実施条件の再検討、高速化したGPGPUの導入によるGCNの再解析を実施して、順調に進展した。
|
Strategy for Future Research Activity |
令和3年度に構築した知識グラフを用いて、令和4年度に開発したグラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を用いて、アルツハイマー病の発症に関連する未知の環境要因、遺伝要因と環境要因の相互作用を同定する。環境曝露としては、飲酒、喫煙、運動、ストレス、仕事、人とのつながりについての項目、検査値としては血液・尿検査の数十の項目、遺伝要因としてはSNPアレイによる数万のバリアントを用いる。得られた遺伝要因と環境要因の相互作用を説明変数間の積の項として、ロジスティッ ク回帰分析に導入することにより、アルツハイマー病の判別精度が高まるかどうかを検証する。これにより同定された遺伝要因と環境要因の相 互作用が確からしいものかを検証する。また、個々人のデータを用いて特徴ベクトルを出力し、この特徴ベクトルをアルツハイマー病のプロフ ァイルとして、正常、未病、アルツハイマー病を判別する。 さらに、患者群、未病、対照群の個々人のデータについて、これらの群を判別す るような特徴量を定義し、その特徴量空間においてポピュレーショングラフを定義する。定義したポピュレーショングラフについて、GCNによ り、畳み込み層、プーリング層、集約層を経て、患者群、未病、対照群の特徴ベクトルを出力する。 この特徴ベクトルを特徴量に用いて、特徴量空間上に、アルツハイマー病の疾患状態を定義し、遺伝要因と環境要因の変動による安定性への影響、生活改善によるリスク低減について評価する。
|