研究課題/領域番号 |
22K12238
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 弘前大学 |
研究代表者 |
玉田 嘉紀 弘前大学, 医学研究科, 教授 (80435495)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2022年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | ベイジアンネットワーク推定 / MCMC / 連合学習 / 遺伝子ネットワーク推定 / ベイジアンネットワーク |
研究開始時の研究の概要 |
本研究は、連合学習を用いたオミクス・データからの生体分子ネットワーク推定法の研究を行う。近年、さまざまなオミクス・データが公共データベースに蓄積され、データ・ドリブン型の生体分子ネットワーク解析で盛んに用いられている。近い将来、個々人がオミクス・データを保有する時代になると、これまで以上に大量のデータが生成され、より精緻な解析ができるようになると期待できる。一方で、それら大量のデータ処理や個人情報保護の問題から、個々人のオミクス・データを一箇所に集約し解析することは現実には困難であると予想される。本研究は、これらの問題を解決することで、分子生物学や新薬開発への貢献を目指す。
|
研究実績の概要 |
まず推定されたベイジアンネットワークモデルからマルコフ連鎖モンテカルロ(MCMC)法によりデータ生成を行い、その生成データから元のベイジアンネットワークを再構成(再推定)する、という方法の検証を行った。条件として 100 変数、平均次数 2.0 のランダムグラフからシミュレーション用データを発生させ、そのデータのみを用いてネットワーク推定し、さらにその推定結果からMCMC法を用いてデータ発生させ、ベイジアンネットワークを推定、元のグラフ構造(正解)と比較を行う、というものである。その結果、Sensitivity (Sn)=0.98, Precision (Pr)=0.95 という高い再構成能力を確認することができた。 連合学習では複数データセットをそれぞれ単独のデータとして学習するものである。この実現可能性を検証するために、次にシミュレーションデータセットを5つに分割し、前述の方法を5回繰り返す、という方法の検証を行った。この際、MCMC法により生成するデータのサンプル数は、分割後のサンプル数である。つまり5つの分割データセットから、5つのネットワークを推定し、MCMCによりデータ生成させ、それをマージしネットワーク推定を行う、という方法である。その結果、Sn=0.97, Pr=0.91 と、ほぼ正解ネットワークと同じネットワークが得られた。 この方法は、MCMC 法で生成したデータをすべて一旦マージして、最終的なネットワークを推定している点で計画書に記載した元のアイディアとは異なるものである。したがって次に MCMC 法の生成データと分割した5つのうち1つのデータをマージする、というのを5回繰り返す方法の性能を検証した。その結果 Sn=0.97, Pr=0.91 と性能は同等であった。 以上より、当初のアイディアでベイジアンネットワークの連合学習が可能であることが示せた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初遅れていたが基本概念の実証が問題なくできたため、遅れを取り戻し概ね順調に進展していると言える。
|
今後の研究の推進方策 |
次年度、大規模化および成果の論文化を行う。 今年度成果は、データが均一な分布の場合である。実データはそうでない場合があるため、その検証も併せて行い、必要に応じて対策を考える。
|