研究課題/領域番号 |
21H03544
|
配分区分 | 補助金 |
研究機関 | 九州大学 |
研究代表者 |
丸山 修 九州大学, 芸術工学研究院, 准教授 (20282519)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
キーワード | Hi-C / エンハンサー / プロモーター / メチル化 / ベクトル表現 / ニューラルネットワーク / CpGアイランド / ゲート型リカレント ユニット |
研究実績の概要 |
本研究の目的は,次世代シーケンサーを活用して得られるクロマチンのコンタクト情報を有効活用する情報科学的手法の研究である.近年Hi-C法の実験により,ゲノムの二つの領域の接触頻度情報が得られるようになり,このデータを組み込んだ数理モデルの構築と有効活用方法の開発が急務の課題となっている. そのような中,次の二つの具板的課題をの研究を進めた.一つは,初年度から継続的に実施している「エンハンサー・プロモーター間相互作用予測のための質の高い負例データ集合の作成方法の研究」である.もう一つは,クロマチン構造との関係性が大きいと言われているエピゲノムデータに関する研究であり,とくに「CpGアイランド(CGI)のDNAメチル化状態の予測手法に関する研究」である. この研究では,マウスの胚盤胞のCGIのDNAメチル化状態予測問題に対して,ランダムに切り出したk-mer配列のベクトル表現をゲート型リカレント ユニットによる再帰型ニューラルネットワークに組み込んだ予測手法を提案し,計算機実験を実施することによりその有効性を示している.単一の CGI シーケンスから得られる可変長k-merのシーケンスの数(N)を増やすことにより,予測精度F値が改善されることを示した.これは、CGIのDNA配列をN個の可変長k-merの配列に変換することによって配列データがもたらす情報量を増強することが有効であることを意味する.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
毎年,1つから2つの小課題を解決していく予定であったためである.
|
今後の研究の推進方策 |
まず,継続的に遂行している「エンハンサー・プロモーター間相互作用予測のための質の高い負例データ集合の作成方法の研究」を成果として発表する. 第2に,次の小課題の本格的展開のフェーズに入る.
|