2023 Fiscal Year Research-status Report
グラフ表現による,構造変異を考慮した転移因子解析基盤の開発
Project/Area Number |
23KJ2044
|
Research Institution | Waseda University |
Principal Investigator |
武田 淳志 早稲田大学, 理工学術院, 特別研究員(DC1)
|
Project Period (FY) |
2023-04-25 – 2026-03-31
|
Keywords | REPrise / 転移因子 / 配列アラインメント |
Outline of Annual Research Achievements |
既存のレファレンスゲノム用のグラフゲノム構築ソフトウェアを利用し, 散在反復配列の主要素である転移因子についてグラフゲノムによる表現をする事前実験を試みた. しかしながら, これを転移因子ファミリ全体に対して適用することは転移因子ファミリの配列多様性が大きく難しいことが分かった. また, 散在反復配列をグラフよりも高い表現力である隠れマルコフモデルでの保持をするDfamを用いた配列生成においても, 転移因子ファミリの配列多様性が大きいことから, 配列類似性の高い配列を生成できない問題があった. 本研究を進めるにあたって, 上記の問題とのギャップを解決するために, 「理論的な方法でグラフゲノムで表現可能なレベルまで転移因子を分類して配列多様性を抑えること」「散在反復配列のアノテーションをより高感度に検出すること」が必要であると考えた. 初年度はこれらの研究の基盤となる散在反復配列検出ソフトウェアREPriseについて発表を行なった. さらに, 上記の問題について対処が可能であるような以下の3つの研究を現在進めている. 1) 転移因子ファミリをさらに細かくサブファミリに分類する技術の開発. 2) 散在反復配列検出ソフトウェアREPriseをはじめとする, 複数の散在反復配列検出ソフトウェアを組み合わせた高性能アノテーションパイプラインの提案. 3)散在反復配列検出ソフトウェアREPriseの高速・並びに高精度化
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初狙っていた, 転移因子配列それ自体を検出し, ファミリ群ごとのグラフ表現によるDB化, 自体は難しいことが分かったため. 現在は, これを可能にするための上流の基礎研究(転移因子配列のサブファミリ分類, 並びに検出パイプラインの提案)を行なっている.
|
Strategy for Future Research Activity |
1) 転移因子ファミリをさらに細かくサブファミリに分類する技術の開発 転移因子配列をさらに細かく分類することにより, グラフ表現に適した集合の配列群を作成する. 2) 散在反復配列検出ソフトウェアREPriseをはじめとする, 複数の散在反復配列検出ソフトウェアを組み合わせた高性能アノテーションパイプラインの提案 散在反復配列ソフトウェアは研究代表者らが開発したREPrise以外にも様々な戦略を取ったソフトウェアが提案されており, それらの強みをうまく引き出すパイプラインによってより高感度な散在反復配列検出ができることが知られている. 既存のソフトウェアと比較したREPriseの強みをより明確にするとともに, REPriseを取り入れたパイプラインの提案をする. 3)散在反復配列検出ソフトウェアREPriseの高速・並びに高精度化 現在REPriseはヒトゲノム長に適用するにあたり, 高感度なモードにおいては1ヶ月程度かかる. REPriseのアルゴリズムを改良することにより, より高速化しつつ, 感度と時間のトレードオフとなるパラメータについて, さらに感度を上げる方向に振ることができるようになることが期待される.
|
Causes of Carryover |
今年度学会に参加予定のため
|