Project/Area Number |
21K10464
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 58030:Hygiene and public health-related: excluding laboratory approach
|
Research Institution | Tohoku University |
Principal Investigator |
大沼 ともみ 東北大学, 東北メディカル・メガバンク機構, 助手 (30884655)
|
Co-Investigator(Kenkyū-buntansha) |
栗山 進一 東北大学, 災害科学国際研究所, 教授 (90361071)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | GWAS / 深層学習 / 機械学習 / 疾患クラスタリング / コホート |
Outline of Research at the Start |
低出生体重と関連する環境要因は、ある程度明らかにされているものの、遺伝要因については十分に明らかとなっていない。われわれの研究室では機械学習のクラスタリングとGWAS解析で自閉スペクトラム症の潜在的遺伝要因を明らかにした。 本研究の目的は、①大規模出生三世代コホートデータを基盤にして得られた表現型の情報を用いて新たに開発する深層学習的手法でクラスタリングを行い、②得られたクラスタリング結果のGWAS解析を行うことで、③低出生体重児の病態解明を行うことである。
|
Outline of Annual Research Achievements |
低出生体重の遺伝的原因を探索のため、今年度は以下1,2を行った。 1クラスタリングで使用しているハイパーパラメータの調整 2クラスタリング以外の深層学習で使用しているハイパーパラメータの調整 1クラスタリングで使用しているハイパーパラメータの調整では、線形/非線形問わずいくつかのクラスタリング手法を用いてどの手法が有用かを検討した。またクラスタリング数を決める過程では複数の評価関数を試用・検討し、低出生体重児の病型について適切なサブグループに分かれるかを検討した。2クラスタリング以外の深層学習で使用しているハイパーパラメータの調整では、深層学習のモデルの複雑さから他のハイパーパラメータの調整も必要であるためその調整を行った。具体的には、深層学習で使われるハイパーパラメータの調整とその候補の探索を行い、以下のようなハイパーパラメータの調整を行った。・ネットワーク層の構成、・事前学習の度合い、・本学習の精度等。さらに、ハイパーパラメータを適切に絞って決定し、分かれたサブグループごとにGWAS解析を開始した。GWAS解析の結果、分けられた病型ごとで異なる候補遺伝子が発見可能か、原因遺伝子の探索を行っている。低出生体重児の病型については多因子疾患である可能性も見えてきており、低出生体重児を産む母親や家族の他のさまざまな病型やそのリスク因子も説明変数として解析に使用する方法も検討している。現在は、学術総会発表や学術論文作成のための準備作業を行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
2022年度は低出生体重児の病型のクラスタリングを計画し 1クラスタリングで使用しているハイパーパラメータの調整 2クラスタリング以外の深層学習で使用しているハイパーパラメータの調整 を行い、深層学習を用いた病型分類が有効である可能性を示した。ただ深層学習のモデルの複雑さによりハイパーパラメータの調整に時間を要しているのと、多因子疾患である可能性が見えているため、低出生体重児の原因となる決定的な候補は見つけられていない。よって、やや遅れている区分を選択した。
|
Strategy for Future Research Activity |
今後の研究推進方策として、引き続きパスウェイ解析の充実・遺伝子を解釈するデータベース群の充実を実施予定である。 また遅れている部分については、内部のゲノムプラットフォームセンターも有効に活用する予定である。 引き続き再現検証は同じToMMo内のデータの他、海外のゲノムデータの参照も行っていく。
|