2022 Fiscal Year Research-status Report
データマイニングと生物学的知見による信頼度を活用した遺伝子型-表現型予測法の開発
Project/Area Number |
20K07324
|
Research Institution | Hamamatsu University School of Medicine |
Principal Investigator |
吉田 秀一 浜松医科大学, 医学部, 助教 (10580574)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 遺伝子型-表現型予測 |
Outline of Annual Research Achievements |
人工知能(AI)による機械学習や深層学習が様々な分野で成果を上げており、盛んに利用され始めている。機械学習法は、学習データの質が予測モデルの性能を大きく左右するが、生命科学分野では様々な制約から予測性能を担保し得るのに十分な学習データを準備できない場合も多い。そこで本研究では、これまでに公共のデータベースに蓄積された生物学・ゲノム医科学的知見から新たに定義する“信頼度”を活用することで、機械学習法における学習データの偏りを補完する新たな遺伝子型‐表現型予測手法の構築を目指している。 今年度は、モデル疾患を対象に真のデータと疑似的な偽のデータとの区分に最適な“信頼度の閾値”の同定と分類精度の評価を交差検証法により行った。しかしながら、本手法を適用することが、必ずしも予測精度の向上につながらないことが新たな課題として浮かび上がった。特に複数の生物学的知見により得られた“信頼度”は、予測精度の向上につながると期待していたが、必ずしもそのような結果は得られなかった。互いの知見が矛盾する結果を示唆している場合や交絡因子の影響などが予測精度向上を妨げる要因として考えられ、現在、“信頼度”を定義する統計学的手法についても再検討している。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
今年度(令和4年度)が最終年度であったが、令和2~3年度に新型コロナ感染症の感染拡大による教育業務の増大(オンライン講義・実験の準備)及び、県を跨ぐ移動自粛による研究打ち合わせや学会への参加見合わせなどによる研究の遅れのため、研究期間を1年延長した。従って、進歩状況は遅れていると評した。
|
Strategy for Future Research Activity |
前年度に引き続き、モデル疾患データセットを用いる交差検証によって最適な信頼度の閾値設定を引き続き行うとともに、新たに見出された課題の解決、モデル疾患以外の遺伝性疾患の遺伝子型‐表現型解析への本手法の有効性の評価を行う。
|
Causes of Carryover |
研究開始年度(令和2年度)からの新型コロナ感染症の拡大とそれに伴う緊急事態宣言等の影響による学会中止、共同研究者との研究打ち合わせの見合わせなどの影響で、申請時に計上していた国内旅費2年分及び海外出張の費用のほとんどが使用されなかったため、次年度使用額が生じた。研究にも遅れが生じ、共同研究者との十分な議論や成果発表も行えていないため、繰り越した研究費は、研究打ち合わせや成果発表旅費として使用する予定である。また、研究期間を1年延長したため、その間の研究の遂行に必要な消耗品の費用にも充てる。
|