• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

データマイニングと生物学的知見による信頼度を活用した遺伝子型-表現型予測法の開発

Research Project

Project/Area Number 20K07324
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 48040:Medical biochemistry-related
Research InstitutionHamamatsu University School of Medicine

Principal Investigator

吉田 秀一  浜松医科大学, 医学部, 助教 (10580574)

Project Period (FY) 2020-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2021: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2020: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywords遺伝子型-表現型予測 / データマイニング
Outline of Research at the Start

遺伝性疾患の責任遺伝子の解明が進む一方、生み出される膨大な候補バリアントから、疾患原因遺伝子変異を絞り込むことは容易ではない。他方、人工知能の一種である機械学習法が様々な分野で成果を上げ、盛んに利用されている。機械学習法は、学習データの質が予測モデルの性能を大きく左右するが、生命科学分野では様々な制約から予測性能を担保し得るのに十分な学習データを準備できない場合も多い。そこで本研究では、これまでに公共のデータベースに蓄積された生物学・ゲノム医科学的知見を活用することで、機械学習法における学習データの偏りを補完した新たな遺伝子型‐表現型予測手法の開発を目的とする。

Outline of Annual Research Achievements

人工知能(AI)による機械学習や深層学習が様々な分野で成果を上げており、盛んに利用され始めている。機械学習法は、学習データの質が予測モデルの性能を大きく左右するが、生命科学分野では様々な制約から予測性能を担保し得るのに十分な学習データを準備できない場合も多い。そこで本研究では、これまでに公共のデータベースに蓄積された生物学・ゲノム医科学的知見から新たに定義する“信頼度”を活用することで、機械学習法における学習データの偏りを補完する新たな遺伝子型‐表現型予測手法の構築を目指している。
<現在までの進捗状況>
モデル疾患を対象に、公共のゲノムデータベース(OMIM、各種疾患データベースなど)に登録されている変異情報と実験的な機能解析や疾患との関連性を紐づけした疾患変異データセットを構築し、このデータセットを用いて真のデータと疑似的な偽のデータとの区分に最適な“信頼度の閾値”の同定と分類精度の評価を交差検証法により行った。しかしながら、本手法を適用することが、必ずしも予測精度の向上につながらないことが新たな課題として浮かび上がった。特に複数の生物学的知見により得られた“信頼度”は、予測精度の向上につながると期待していたが、必ずしもそのような結果は得られなかった。
<今後の研究の推進方策>
任意の変異に対し複数の生物学的知見が紐づけされている際、特に互いの知見が矛盾する結果を示唆している場合の影響などが予測精度向上を妨げる要因として考えられた。したがって、このような場合には、個々の知見を用いるのではなく、それらをメタ解析することで、複数の実験の結果を統合して予測因子として用いて対応することとした。一方、研究デザインが大きく異なることにより、メタ解析による対応が難しいケースについての対応については、今後の課題とした。

Current Status of Research Progress
Current Status of Research Progress

4: Progress in research has been delayed.

Reason

令和2~3年度に新型コロナ感染症の感染拡大による教育業務の増大(オンライン講義・実験の準備)及び、県を跨ぐ移動自粛による研究打ち合わせや学会への参加見合わせなどによる研究の遅れのため、研究期間を延長した。従って、進歩状況は遅れていると評した。

Strategy for Future Research Activity

任意の変異に対し複数の生物学的知見が紐づけされているときに、特に互いの知見が矛盾する結果を示唆している場合の影響などが予測精度向上を妨げる要因として考えられた。したがって、このような場合には、個々の知見を用いるのではなく、それらをメタ解析することで、複数の実験の結果を統合して予測因子として用いて対応することとした。今年度は本改良を行った後、モデル疾患データセットを用いる交差検証によって最適な信頼度の閾値設定を引き続き行い本手法の有効性を評価する。

Report

(4 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi