2021 Fiscal Year Annual Research Report
新規遺伝子制御ネットワーク推定手法によるネムリユスリカ乾燥耐性機構の解明
Project/Area Number |
21J20961
|
Allocation Type | Single-year Grants |
Research Institution | Keio University |
Principal Investigator |
比企 佑介 慶應義塾大学, 理工学研究科, 特別研究員(DC1)
|
Project Period (FY) |
2021-04-28 – 2024-03-31
|
Keywords | ネムリユスリカ / 乾燥耐性 / 遺伝子制御ネットワーク / ネットワーク推定 / 深層学習 |
Outline of Annual Research Achievements |
昆虫の一種であるネムリユスリカの幼虫は極限的な乾燥耐性を持つ。これまでにネムリユスリカの乾燥耐性に重要な遺伝子群が同定されているが、それらがどのように制御されているのかは未知である。 そこで本研究課題では、時系列で取得された遺伝子発現量データから遺伝子間の制御関係を表す遺伝子制御ネットワークを正確に推定可能なアルゴリズムを開発し、それを適用することでネムリユスリカの乾燥耐性機構を明らかにすることを目的としている。この目的を達成するために本研究は、(1)in vivoデータに対して高精度に遺伝子制御ネットワーク推定を可能なアルゴリズムの構築および評価、(2)ネムリユスリカの乾燥耐性に関与する遺伝子制御ネットワークの実験的同定を行う。 上記2つの課題のうち、令和3年度は(1)in vivoデータに対して高精度に遺伝子制御ネットワーク推定を可能なアルゴリズムの構築および評価を行った。時系列遺伝子発現量から遺伝子制御ネットワークを推定するアルゴリズムとして、1. 畳み込みニューラルネットワークを用いた2遺伝子間制御関係分類モデルに基づくアルゴリズムと2. Attention LSTMを用いた標的遺伝子発現量の回帰モデルに基づくアルゴリズムの2種類のアルゴリズムを構築し、精度評価を行った。その結果2.のアルゴリズムで、in vivoデータにおいて既存手法の精度を上回った。また、10から100遺伝子までの様々なサイズを持つ遺伝子制御ネットワークおよびそれに基づいて得られる時系列遺伝子発現量データを既存の確率モデルシミュレータ(GeneNetWeaver)によって生成し、それらのデータセットを用いて2.のアルゴリズムの評価を行った。その結果、本手法は既存手法の精度の推移と同様に、遺伝子数が30以上になると精度が急激に低下した一方で、遺伝子数が多い場合に他手法より高い精度を保つ傾向を示した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和3年度は、(1)in vivoデータに対して高精度に遺伝子制御ネットワーク推定を可能なアルゴリズムの構築および評価を行い、in vivoデータにおいて既存手法を上回るアルゴリズムを開発した。これは、(2)ネムリユスリカの乾燥耐性に関与する遺伝子制御ネットワークの実験的同定を行う上で必須の基盤技術であり、研究計画全体の律速となる課題であったという点で、おおむね順調に進行していると考えられる。また、in vivoデータにおいて精度が低いという課題は、多数提案されている既存手法のいずれも直面しており、解決が困難な課題である。現状の精度評価の結果から、遺伝子数の増大に伴って精度が低下するという問題点は残っているものの、本アルゴリズムがin vivoデータにおける精度向上を達成できる可能性を示すことができたため、令和3年度は十分な成果が得られたと考えられる。
|
Strategy for Future Research Activity |
現在までの進捗状況を踏まえて令和4年度は、令和3年度に開発したアルゴリズムの改良を目的とした以下のような課題に取り組む。 課題1. 遺伝子数の増大に対する精度低下の軽減 上記の課題点に対して、多変量回帰における変数選択に有効であることが示されている正則化の導入を適用するといった工夫を行うことで、遺伝子数の増大による精度低下を軽減することを目指す。 課題2. 遺伝子数および時系列数の変化に対する本手法の精度推移の評価 令和3年度は、推定するネットワークを構成する遺伝子数を変化させた場合に、本手法の推定精度がどのように推移するかを詳細に検証するため、確率モデルシミュレータ(GeneNetWeaver)を用いて100 遺伝子までのサイズを持つデータセットを生成し、評価を行った。令和4年度は、ネムリユスリカの転写因子数である250個程度のサイズまでデータセットを拡張し、評価を行う。また、入力となる時系列遺伝子発現量データの時系列数も遺伝子制御ネットワーク推定の精度に影響する。そこで、時系列数の変化に対して本手法の推定精度がどのように推移するかを評価する。
|