研究課題
近年の網羅的解析により、細胞内に発現するRNAの大多数がタンパク質をコードしない非コードRNA (ncRNA) であることが明らかとなった。G4重鎖は核酸中のグアニンに富んだ配列に形成される特殊な高次構造であり、ncRNA中に豊富に存在している可能性が近年指摘されている。しかし、生物学的意義や異なる種間での保存性、そのゲノム全体での規模など未解明な部分が多い。本研究では、比較構造情報解析を行うことで、従来見過ごされてきたncRNA中の種間で保存されたG4重鎖領域をゲノムワイドに同定することを目的とする。具体的に、G4重鎖候補領域を深層学習により予測した後、粗視化された構造情報をもとに種間での比較構造解析を行う。今年度は、畳み込みニューラルネットワーク (CNN) に基づいたG4重鎖識別モデルの性能評価を行い、高い予測精度を達成することを確認した。一方、CNNとは別の角度からのモデル化を検討するため、自然言語処理分野で強力な実績を誇るBERT (Bidirectional Encoder Representations from Transformers) に基づいた識別モデルを設計するに至った。今後詳細な計算機実験や比較検討を行う予定である。
3: やや遅れている
G4重鎖識別モデルを用いた種間での保存性に関する実験および考察を実施していない。また、昨年度同様、感染症蔓延状況のため、共同研究者との議論のための出張が不可能となった。したがって、本研究課題の進捗状況はやや遅れていると考えており、補助事業期間の再延長申請を行った次第である。
BERTに基づく提案手法と既存手法との性能評価を網羅的に行う。また、所属研究室の協力を得て、ウェット実験によりマウスのrG4-seqデータを生成する。次に、マウストランスクリプトーム配列データを用いた予測結果と、実際のウェット実験によるG4重鎖同定結果を比較することで、種間の保存性を示す上での提案手法の有効性を実証したいと考えている。
今年度も昨年度同様に新型コロナ感染症の影響により、出張が行えず、旅費として計上していた金額が完全に使用できなかったため、次年度使用額が生じた。
すべて 2021 その他
すべて 国際共同研究 (1件) 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 1件) 学会発表 (2件) (うち国際学会 1件)
PLoS Genetics
巻: 17, ページ: -
10.1371/journal.pgen.1009516
Immunity
巻: 54 ページ: 1976-1988
10.1016/j.immuni.2021.08.022
GLIA
巻: 69 ページ: 2591-2604
10.1002/glia.24060
The Journal of Immunology
巻: 207 ページ: 3016-3027
10.4049/jimmunol.2100526