研究課題/領域番号 |
21K10464
|
研究機関 | 東北大学 |
研究代表者 |
大沼 ともみ 東北大学, 東北メディカル・メガバンク機構, 助手 (30884655)
|
研究分担者 |
栗山 進一 東北大学, 災害科学国際研究所, 教授 (90361071)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | GWAS / 深層学習 / 機械学習 / 疾患クラスタリング / コホート |
研究実績の概要 |
低出生体重の遺伝的原因を探索のため、今年度は以下1,2を行った。 1クラスタリングで使用しているハイパーパラメータの調整 2クラスタリング以外の深層学習で使用しているハイパーパラメータの調整 1クラスタリングで使用しているハイパーパラメータの調整では、線形/非線形問わずいくつかのクラスタリング手法を用いてどの手法が有用かを検討した。またクラスタリング数を決める過程では複数の評価関数を試用・検討し、低出生体重児の病型について適切なサブグループに分かれるかを検討した。2クラスタリング以外の深層学習で使用しているハイパーパラメータの調整では、深層学習のモデルの複雑さから他のハイパーパラメータの調整も必要であるためその調整を行った。具体的には、深層学習で使われるハイパーパラメータの調整とその候補の探索を行い、以下のようなハイパーパラメータの調整を行った。・ネットワーク層の構成、・事前学習の度合い、・本学習の精度等。さらに、ハイパーパラメータを適切に絞って決定し、分かれたサブグループごとにGWAS解析を開始した。GWAS解析の結果、分けられた病型ごとで異なる候補遺伝子が発見可能か、原因遺伝子の探索を行っている。低出生体重児の病型については多因子疾患である可能性も見えてきており、低出生体重児を産む母親や家族の他のさまざまな病型やそのリスク因子も説明変数として解析に使用する方法も検討している。現在は、学術総会発表や学術論文作成のための準備作業を行っている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2022年度は低出生体重児の病型のクラスタリングを計画し 1クラスタリングで使用しているハイパーパラメータの調整 2クラスタリング以外の深層学習で使用しているハイパーパラメータの調整 を行い、深層学習を用いた病型分類が有効である可能性を示した。ただ深層学習のモデルの複雑さによりハイパーパラメータの調整に時間を要しているのと、多因子疾患である可能性が見えているため、低出生体重児の原因となる決定的な候補は見つけられていない。よって、やや遅れている区分を選択した。
|
今後の研究の推進方策 |
今後の研究推進方策として、引き続きパスウェイ解析の充実・遺伝子を解釈するデータベース群の充実を実施予定である。 また遅れている部分については、内部のゲノムプラットフォームセンターも有効に活用する予定である。 引き続き再現検証は同じToMMo内のデータの他、海外のゲノムデータの参照も行っていく。
|
次年度使用額が生じた理由 |
次年度は最終年度であるため成果発表のために、論文投稿費や学術総会への参加費出張費が発生することを見こした使用計画としている。
|