Project/Area Number |
21H03537
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Tohoku University |
Principal Investigator |
荻島 創一 東北大学, 未来型医療創成センター, 教授 (40447496)
|
Co-Investigator(Kenkyū-buntansha) |
川島 秀一 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (50314274)
宮下 哲典 新潟大学, 脳研究所, 准教授 (60323995)
片山 俊明 大学共同利用機関法人情報・システム研究機構(機構本部施設等), データサイエンス共同利用基盤施設, 特任准教授 (60396869)
鎌田 真由美 京都大学, 医学研究科, 准教授 (70749077)
小島 諒介 京都大学, 医学研究科, 講師 (70807651)
水野 聖士 東北大学, 東北メディカル・メガバンク機構, 助教 (80646795)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2023: ¥5,070,000 (Direct Cost: ¥3,900,000、Indirect Cost: ¥1,170,000)
Fiscal Year 2022: ¥4,550,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥1,050,000)
Fiscal Year 2021: ¥7,800,000 (Direct Cost: ¥6,000,000、Indirect Cost: ¥1,800,000)
|
Keywords | 多因子疾患の発症機序 / 遺伝子・環境相互作用 / アルツハイマー病 / 機械学習 / 深層学習 |
Outline of Research at the Start |
多因子疾患として、アルツハイマー病の疾患発症に対する、環境曝露の影響や遺伝要因との相互作用について、深層学習を用いたシステム的解明に取り組む。環境要因、臨床表現型、遺伝要因の知識を収集して知識グラフを構築し、UKBiobankと新潟大学脳研究所のアルツハイマー病患者群および対照群のデータ、東北メディカル・メガバンク計画の対照群のデータを用い、深層学習の機械学習手法を開発する。アルツハイマー病の発症に関連する未知の環境要因、遺伝要因と環境要因の相互作用を解明し、個々人のデータに対する特徴ベクトルを、アルツハイマー病を判別するプロファイルとして最適化し、正常、未病、アルツハイマー病を判別する。
|
Outline of Annual Research Achievements |
本研究課題は、多因子疾患として、アルツハイマー病の疾患発症に対する、環境曝露の影響や遺伝要因との相互作用について、深層学習を用いたシステム的解明に取り組む。そのため、初年度はまず、環境要因、臨床表現型、検査値、分子、遺伝要因の関係のデータを収集し、大規模な知識グラフを構築した。疾患名と臨床表現型の関係、臨床 表現型と検査値の関係は、ClinVarなどの医科学データの RDF (Resource Description Framework) リソース Med2RDF (http://med2rdf.org/)や、ヒト表現型異常のHuman Phenotype Ontology)、臨床ゲノム 情報統合データベース MGeND (https://mgend.med.kyoto-u.ac.jp/) を用いて、構築した。環境要因と分子、遺伝要因の関係のデータはアルツハイマー病のパスウェイマップAlzPathway (http://www.alzpathway.org/) をベースに構築した。AlzPathwayは研究代表者と分担者が開発するアルツハイマー病のリスク候補遺伝子探索および疾患機序の解明のためのパスウェイマップであり、環境要因、臨床表現型、検査値、分子、遺伝要因を統合するベースとした。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
環境要因、臨床表現型、検査値、分子、遺伝要因の関係のデータを収集し、大規模な知識グラフを構築した。疾患名と臨床表現型の関係、臨床 表現型と検査値の関係は、ClinVarなどの医科学データの RDF (Resource Description Framework) リソース Med2RDF (http://med2rdf.org/)や、ヒト表現型異常のHuman Phenotype Ontology)、臨床ゲノム 情報統合データベース MGeND (https://mgend.med.kyoto-u.ac.jp/) を用いて、構築した。環境要因と分子、遺伝要因の関係のデータはアルツハイマー病のパスウェイマップAlzPathway (http://www.alzpathway.org/) をベースに構築した。AlzPathwayは研究代表者と分担者が開発するアルツハイマー病のリスク候補遺伝子探索および疾患機序の解明のためのパスウェイマップであり、環境要因、臨床表現型、検査値、分子、遺伝要因を統合するベースとした。
|
Strategy for Future Research Activity |
令和3年度に構築した知識グラフを用いて、グラフ畳み込みネットワークモデルを用いた深層学習の機械学習手法を開発する。 臨床表現型、環境要因、検査値・分子濃度、遺伝要因のノードから構成される知識グラフを用いて、リンクに意味関係をもたせた知識グラフネ ットワークを構築する。このグラフネットワークの臨床表現型、環境要因、検査値・分子濃度、遺伝要因の各ノードの特徴量ベクトルとして、 アルツハイマー病の患者群のデータ、対照群のデータを用いる。このとき必ずしも知識グラフで定義されていない臨床表現型、環境要因、検査 値・分子濃度、遺伝要因も孤立ノードとしてデータを用いる。 Graph Convolutional Network (GCN) として、Graph Autoencoder Modelを用いて、これらの特徴量ベクトルから孤立ノードと既存のノードと のリンク予測を行う方法を開発する。研究分担者の小島はすでに生命科学のデータ用にグラフベースの深層学習のパッケージkGCN (a graph-ba sed deep learning framework for life science) (https://github.com/clinfo/kGCN) を開発しており、これをベースに開発する。これによ り、アルツハイマー病の発症に関連する未知の環境要因、遺伝要因、遺伝要因と環境要因の相互作用を同定する方法とする。 また、個々人のデータに対して、GCNにより、畳み込み層、プーリング層、集約層を経て、個々人の特徴ベクトルを出力する方法を開発する。 この特徴ベクトルをアルツハイマー病のプロファイルとして、正常、未病、アルツハイマー病の判別ができるように最適化する方法を開発する 。
|