研究課題/領域番号 |
18H04127
|
研究機関 | 慶應義塾大学 |
研究代表者 |
榊原 康文 慶應義塾大学, 理工学部(矢上), 教授 (10287427)
|
研究分担者 |
佐々木 えりか 公益財団法人実験動物中央研究所, マーモセット医学生物学研究部, 部長 (70390739)
星野 敦 基礎生物学研究所, 多様性生物学研究室, 助教 (80312205)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | 非コードRNA / 遺伝子発見 / バイオインフォマティクス / 深層学習 |
研究実績の概要 |
これまで主に画像解析に用いられてきた深層学習手法の畳み込みニューラルネットワークや自然言語処理で用いられてきた文字列変換器を,非コードRNA配列に適用し,配列の分類やクラスタリング,そして機能解析を行うというバイオインフォマティクスの分野で最新の手法を提案した.具体的には,教師無し深層学習に基づく非コードRNAクラスタリングのアルゴリズムRNA-BERT(NAR Genomics and Bioinformatics誌掲載済)を開発した.RNA配列を効果的に埋め込むために,事前学習アルゴリズムを適用して,構造情報や配列の文脈情報を効果的に取り込んだRNA配列の埋め込みベクトルを計算する手法を開発した.事前学習によって得られた埋め込みベクトルの精度を検証するために,非コードRNAクラスタリングによるテストを実施し、既存の方法よりも優れた精度を達成した. 分担者である佐々木は,研究代表者のメタゲノムとメタトランススクリプトームを統合し、腸管部位間のマイクロバイオームの機能活性を解析可能にする新規手法開発に向け、健常個体のコモンマーモセット選定を実施し、DNAおよびRNA抽出用の食道、胃、十二指腸、小腸、大腸、糞便のサンプリングを実施した。細菌叢のDNAとTotal RNA抽出後,次世代シークエンサーによってRNA-Seqを行なった.現在,シークエンスされたデータを解析中である. アサガオ花弁より発生段階を追ってサンプリングしたtotal RNAからライブラリーを調整し,RNA-seqを行った.サンプリングは開花72時間前から開花12時間後の3日半,3時間毎に3反復して行った.ゲノム編集で変異導入したアサガオが雌性不稔であることを確認した.リファレンスゲノム配列の精度を向上するために,一分子リアルタイムDNAシークエンサーと,Saphyrシステムによる光学マッピングによるアセンブリの統合を試みた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
教師無し深層学習に基づく非コードRNAクラスタリングのアルゴリズムRNA-BERTを完成して,その研究成果をまとめた論文を国際学術誌に掲載した.(NAR Genomics and Bioinformatics誌掲載済). マーモセット胚の疑似着床培養技術を確立し,single RNA seqを実施した結果,マーモセット胚が疑似着床培養により,原腸陥入期までin vitroで発生していることが強く示唆された. アサガオ花弁のtotal RNAから,87のライブラリーを調整してRNA-seqを行った.合計で722Mリード,1サンプルあたり平均8.3Mのリードが得られた.ゲノム編集で作出した変異体は,胚珠の発生に異常が見られた.ゲノム配列と光学マッピングのアセンブリを統合したハイブリッドアセンブリを作成した.
|
今後の研究の推進方策 |
2021年度に開発した教師無し深層学習に基づく非コードRNAクラスタリングのアルゴリズムRNA-BERTをさらに改良して,最高精度を達成して,業界の標準となるように成果を発信する. 2021年度に引き続きマーモセット健常個体の解剖により得られた各臓器,とくに近年注目されている腸内細菌叢に着目することに研究計画を方針転換して、大腸や盲腸などの消化管各組織からサンプル調製を行い,RNA-seqを続行する.また,マーモセット胚の疑似着床培養のsmall RNA-seqを行うことで,どのようなsmall RNAがマーモセット初期発生に関与しているかを明らかにしたい. RNA-seqのデータの解析と,アサガオ花弁で発現する非コードRNAの探索を行い,発生段階を追った非コードRNAの発現レベルの変動を明らかにする.ゲノム編集で作出した変異体に見られる胚珠の発生異常の詳細を検討する.ハイブリッドアセンブリを検証してリファレンスゲノムの精度を向上し,非コードRNAの探索に活用する.
|