研究課題/領域番号 |
17K20032
|
研究機関 | 早稲田大学 |
研究代表者 |
浜田 道昭 早稲田大学, 理工学術院, 教授 (00596538)
|
研究分担者 |
岩切 淳一 東京大学, 大学院新領域創成科学研究科, 助教 (40770160)
|
研究期間 (年度) |
2017-06-30 – 2021-03-31
|
キーワード | クロマチン / lncRNA / 長鎖ノンコーディングRNA / ランダムフォレスト / R-loop |
研究実績の概要 |
哺乳類ゲノムの大部分は,コーディングあるいはノンコーディングRNAを転写している.このうちノンコーディングRNAの一部は,クロマチンと相互作用を行い,エピジェネティックな制御を行っていることが示唆されている.RNAとクロマチン相互作用のメカニズムを解明するために,lncRNAとクロマチンの相互作用予測を行うモデルを構築し,構築したモデルからどのような特徴が相互作用い寄与しているかの検討を行った.今回考えた特徴としては下記のものである:R-loop形成,RNA:DNA triplex, RNA結合によるscafold.このうち,R-loop形成に関しては配列相補性をアラインメントにより同定することにより推定した.またこの際には,RNAアクセシビリティも考慮するようにした.RNA:DNA triplexに関しては,既存のtriplex予測ツールを利用した.機械学習モデルとしては,ランダムフォレストを主に利用した.これは,ランダムフォレストは,分類に寄与した特徴量の導出が容易に可能となるためである.実際のデータとしては,RNAクロマチン相互作用に関する大規模実験データを用いて,正例と負例を作成し,構築したモデルの学習を行った.予測精度の評価はクロスバリデーションを用いたが,現状十分な予測精度は出ていない.特徴量および学習データの両面から現在詳細に検討を行っている段階である.機械学習モデルに関しても深層学習なども含めて検討を行うことを計画している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
現状,構築した予測モデルにおいて,十分な予測精度が得られていないため
|
今後の研究の推進方策 |
予測モデルの改善を行うと同時に,学習に活用可能な実験データの収集を行う.また,特徴量についてもさらなる検討を行う.
|
次年度使用額が生じた理由 |
RNA-クロマチン相互作用の新しい網羅的実験手法が複数出てきた.これらの実験手法から得られ るデータを本研究に用いることを検討する必要が生じたため,次年度使用額が生じた.今年度は人件費として活用し研究を加速させる計画である.
|