研究課題/領域番号 |
17F17797
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 外国 |
研究分野 |
遺伝・染色体動態
|
研究機関 | 東京大学 |
研究代表者 |
中井 謙太 東京大学, 医科学研究所, 教授 (60217643)
|
研究分担者 |
BERTHIER VINCENT 東京大学, 医科学研究所, 外国人特別研究員
|
研究期間 (年度) |
2017-11-10 – 2020-03-31
|
研究課題ステータス |
交付 (2019年度)
|
配分額 *注記 |
1,500千円 (直接経費: 1,500千円)
2019年度: 400千円 (直接経費: 400千円)
2018年度: 700千円 (直接経費: 700千円)
2017年度: 400千円 (直接経費: 400千円)
|
キーワード | エンハンサー同定 / リカレントネットワーク / 細胞種特異的エンハンサー / 特徴抽出 / Optimization / Genetic Algorithm / DNA / motif finding |
研究実績の概要 |
The past year has been dedicated to try and identify enhancer regions in the complete human genome by using recurrent neural networks. By taking the whole genome in consideration, and not just some very limited and specific regions, the hope was to reach a more comprehensive understanding of those regions and identify some as of yet unknown enhancers.The results, while significantly better than random, were not as good as hoped. State of the art enhancer identification reaches a success rate of more than 90%, but our results hovered around 60%. While it is definitely a problem that could be tackled in the future, the relatively small dataset available (in opposition to the size of the genome) made it too difficult for the current machine learning techniques to work: they require both strong ground truth and a big dataset. Sadly the hope that the available data would be enough didn't match reality.The research as since then evolved into a slightly different direction, aiming at being able to identify which enhancer is active in which cell lines. We believe that our experience for studying the motif finding problem using the genetic algorithm would be effective in this direction and thus we will explore this possibility during the remaining term.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究は当初計画していたより、進捗が若干遅れている。 その主な理由は、特別研究員がまったく別の分野からこの分野の研究を始めたため、いわゆる深層学習のもつゲノム配列解析能力に対する過信があったと思っている。代表者の中井はこれまでの自分の経験からいっても、若干無謀な試みではないかとアドバイスしたが、その一方でもしかするとこれまで予想もしていなかった新しい結果の緒が得られる可能性もあると思って、強く研究方向を変えるようには指導しなかった。
|
今後の研究の推進方策 |
特別研究員はここで仕事をはじめた当初、以前から慣れ親しんでいた遺伝的アルゴリズムを使って、モチーフ抽出の問題を最初に試していた。残された時間は少ないので、この枠組を使って、細胞種特異的エンハンサーの特徴づけに取り組んでもらうこととした。残りの時間を精一杯活用して、一定の成果をあげたいと考えている。
|