研究課題/領域番号 |
19J21608
|
研究機関 | 東京大学 |
研究代表者 |
横山 稔之 東京大学, 新領域創成科学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2019-04-25 – 2022-03-31
|
キーワード | ゲノム解析 / ゲノム科学 / 可視化 / グラフ |
研究実績の概要 |
本研究では、ヒト等の様々な生物種をその対象として、ゲノムを1本の線ではなく、情報科学におけるグラフ構造を用いて、分岐やループなど様々なパターンを表現するグラフゲノムというデータ構造のもと、その構築に関連するアルゴリズム開発を、可視化を通して行うことを目指している。 今年度は、以前より開発を続けているグラフゲノムブラウザ及び、その関連ツールの開発を継続しており、新たなアノテーション情報や、構造多型フォーマットを読み込むための実装を追加した。それとともに、可視化に関する要素技術および、関連する可視化手法についても調査を実施し、その成果は論文として出版されている。 また、ゲノムに関連する様々なアノテーション情報をデータ構造の上に統合することにより、より効率的なデータ解析を可能にするために、グラフゲノムのデータフォーマットとしてのデータ構造や、グラフデータベースの調査を進めている。特にアノテーションを格納するためのデータ構造や、グラフデータベースのAPI及び、ナレッジグラフ等に基づく応用について調査と検討を行っており、来年度以降、実装を進めていく予定である。 最後にグラフゲノムの実データへの応用に関して、培養細胞から次世代DNAシーケンサーを用いて得られた、シーケンシングデータを用いた解析を進めている。現在は解析を通して、グラフゲノムを適用するために必要な手法及び条件の検討を進めており、様々なユースケースに適用可能な手法の構築を目指していく。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度は、各種フォーマットへの対応や機能の拡充など、継続して取り組んでいる可視化ツールの開発が進んでいる。また、グラフゲノムの実データへの応用についても、シーケンシングデータを用いた解析を進めている。従って、順調に進展していると考えられる。
|
今後の研究の推進方策 |
今後は、アノテーションを格納するためのデータ構造、グラフデータベースのAPI及びナレッジグラフに関する技術に基づく応用とデータ統合について調査し、必要に応じて実装を進める。こうして実装されたツールをもとに、現在は実データへの応用として、培養細胞に対する検証の幅を広げて、様々なユースケースにおけるグラフゲノムによる解析を検討している。
|