2022 Fiscal Year Annual Research Report
Mathematical analysis and applications in the 3D genome
Project/Area Number |
21H03544
|
Allocation Type | Single-year Grants |
Research Institution | Kyushu University |
Principal Investigator |
丸山 修 九州大学, 芸術工学研究院, 准教授 (20282519)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | Hi-C / エンハンサー / プロモーター / メチル化 / ベクトル表現 / ニューラルネットワーク / CpGアイランド / ゲート型リカレント ユニット |
Outline of Annual Research Achievements |
本研究の目的は,次世代シーケンサーを活用して得られるクロマチンのコンタクト情報を有効活用する情報科学的手法の研究である.近年Hi-C法の実験により,ゲノムの二つの領域の接触頻度情報が得られるようになり,このデータを組み込んだ数理モデルの構築と有効活用方法の開発が急務の課題となっている. そのような中,次の二つの具板的課題をの研究を進めた.一つは,初年度から継続的に実施している「エンハンサー・プロモーター間相互作用予測のための質の高い負例データ集合の作成方法の研究」である.もう一つは,クロマチン構造との関係性が大きいと言われているエピゲノムデータに関する研究であり,とくに「CpGアイランド(CGI)のDNAメチル化状態の予測手法に関する研究」である. この研究では,マウスの胚盤胞のCGIのDNAメチル化状態予測問題に対して,ランダムに切り出したk-mer配列のベクトル表現をゲート型リカレント ユニットによる再帰型ニューラルネットワークに組み込んだ予測手法を提案し,計算機実験を実施することによりその有効性を示している.単一の CGI シーケンスから得られる可変長k-merのシーケンスの数(N)を増やすことにより,予測精度F値が改善されることを示した.これは、CGIのDNA配列をN個の可変長k-merの配列に変換することによって配列データがもたらす情報量を増強することが有効であることを意味する.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
毎年,1つから2つの小課題を解決していく予定であったためである.
|
Strategy for Future Research Activity |
まず,継続的に遂行している「エンハンサー・プロモーター間相互作用予測のための質の高い負例データ集合の作成方法の研究」を成果として発表する. 第2に,次の小課題の本格的展開のフェーズに入る.
|