研究課題/領域番号 |
20K07324
|
研究機関 | 浜松医科大学 |
研究代表者 |
吉田 秀一 浜松医科大学, 医学部, 助教 (10580574)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
キーワード | 遺伝子型-表現型予測 |
研究実績の概要 |
人工知能(AI)による機械学習や深層学習が様々な分野で成果を上げており、盛んに利用され始めている。機械学習法は、学習データの質が予測モデルの性能を大きく左右するが、生命科学分野では様々な制約から予測性能を担保し得るのに十分な学習データを準備できない場合も多い。そこで本研究では、これまでに公共のデータベースに蓄積された生物学・ゲノム医科学的知見から新たに定義する“信頼度”を活用することで、機械学習法における学習データの偏りを補完する新たな遺伝子型‐表現型予測手法の構築を目指している。 <現在までの進捗状況> モデル疾患を対象に、公共のゲノムデータベース(OMIM、各種疾患データベースなど)に登録されている変異情報と実験的な機能解析や疾患との関連性を紐づけした疾患変異データセットを構築し、このデータセットを用いて真のデータと疑似的な偽のデータとの区分に最適な“信頼度の閾値”の同定と分類精度の評価を交差検証法により行った。しかしながら、本手法を適用することが、必ずしも予測精度の向上につながらないことが新たな課題として浮かび上がった。特に複数の生物学的知見により得られた“信頼度”は、予測精度の向上につながると期待していたが、必ずしもそのような結果は得られなかった。 <今後の研究の推進方策> 任意の変異に対し複数の生物学的知見が紐づけされている際、特に互いの知見が矛盾する結果を示唆している場合の影響などが予測精度向上を妨げる要因として考えられた。したがって、このような場合には、個々の知見を用いるのではなく、それらをメタ解析することで、複数の実験の結果を統合して予測因子として用いて対応することとした。一方、研究デザインが大きく異なることにより、メタ解析による対応が難しいケースについての対応については、今後の課題とした。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
令和2~3年度に新型コロナ感染症の感染拡大による教育業務の増大(オンライン講義・実験の準備)及び、県を跨ぐ移動自粛による研究打ち合わせや学会への参加見合わせなどによる研究の遅れのため、研究期間を延長した。従って、進歩状況は遅れていると評した。
|
今後の研究の推進方策 |
任意の変異に対し複数の生物学的知見が紐づけされているときに、特に互いの知見が矛盾する結果を示唆している場合の影響などが予測精度向上を妨げる要因として考えられた。したがって、このような場合には、個々の知見を用いるのではなく、それらをメタ解析することで、複数の実験の結果を統合して予測因子として用いて対応することとした。今年度は本改良を行った後、モデル疾患データセットを用いる交差検証によって最適な信頼度の閾値設定を引き続き行い本手法の有効性を評価する。
|
次年度使用額が生じた理由 |
最終年度に国際学会への成果発表旅費として計上していたものが次年度使用額として生じた。これは、コロナ過では海外渡航が難しかったこと、コロナ明けの現在は大幅な円安、物価高により、申請時に見込んでいた海外での成果発表旅費での海外渡航費用を賄うことが難しいことが原因である。従って、国内での学会等の旅費及び研究期間延長に伴う消耗品等の購入費としての活用を検討している。
|