• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

グラフ表現による,構造変異を考慮した転移因子解析基盤の開発

Research Project

Project/Area Number 23KJ2044
Research Category

Grant-in-Aid for JSPS Fellows

Allocation TypeMulti-year Fund
Section国内
Review Section Basic Section 62010:Life, health and medical informatics-related
Research InstitutionWaseda University

Principal Investigator

武田 淳志  早稲田大学, 理工学術院, 特別研究員(DC1)

Project Period (FY) 2023-04-25 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥2,700,000 (Direct Cost: ¥2,700,000)
Fiscal Year 2025: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2024: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2023: ¥900,000 (Direct Cost: ¥900,000)
KeywordsREPrise / 転移因子 / 配列アラインメント
Outline of Research at the Start

多くの高等真核生物のゲノムは, 転移因子(TE)と呼ばれる繰り返し配列に由来する. TE配列は自身を複製してゲノム中に伝播するが, それに伴い大小様々な変異によって配列が変化する. 従って, 一本の代表配列では十分にTE配列の情報を保持することができない.
本研究では, 変異を考慮した配列表現方法として注目されているグラフを利用し, グラフを用いたTEデータベース, TE検出アルゴリズムの開発を通じてTE研究のゴールドスタンダードを提供することを目的とする.

Outline of Annual Research Achievements

既存のレファレンスゲノム用のグラフゲノム構築ソフトウェアを利用し, 散在反復配列の主要素である転移因子についてグラフゲノムによる表現をする事前実験を試みた. しかしながら, これを転移因子ファミリ全体に対して適用することは転移因子ファミリの配列多様性が大きく難しいことが分かった. また, 散在反復配列をグラフよりも高い表現力である隠れマルコフモデルでの保持をするDfamを用いた配列生成においても, 転移因子ファミリの配列多様性が大きいことから, 配列類似性の高い配列を生成できない問題があった.
本研究を進めるにあたって, 上記の問題とのギャップを解決するために, 「理論的な方法でグラフゲノムで表現可能なレベルまで転移因子を分類して配列多様性を抑えること」「散在反復配列のアノテーションをより高感度に検出すること」が必要であると考えた.
初年度はこれらの研究の基盤となる散在反復配列検出ソフトウェアREPriseについて発表を行なった. さらに, 上記の問題について対処が可能であるような以下の3つの研究を現在進めている.
1) 転移因子ファミリをさらに細かくサブファミリに分類する技術の開発. 2) 散在反復配列検出ソフトウェアREPriseをはじめとする, 複数の散在反復配列検出ソフトウェアを組み合わせた高性能アノテーションパイプラインの提案. 3)散在反復配列検出ソフトウェアREPriseの高速・並びに高精度化

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

当初狙っていた, 転移因子配列それ自体を検出し, ファミリ群ごとのグラフ表現によるDB化, 自体は難しいことが分かったため. 現在は, これを可能にするための上流の基礎研究(転移因子配列のサブファミリ分類, 並びに検出パイプラインの提案)を行なっている.

Strategy for Future Research Activity

1) 転移因子ファミリをさらに細かくサブファミリに分類する技術の開発
転移因子配列をさらに細かく分類することにより, グラフ表現に適した集合の配列群を作成する.
2) 散在反復配列検出ソフトウェアREPriseをはじめとする, 複数の散在反復配列検出ソフトウェアを組み合わせた高性能アノテーションパイプラインの提案
散在反復配列ソフトウェアは研究代表者らが開発したREPrise以外にも様々な戦略を取ったソフトウェアが提案されており, それらの強みをうまく引き出すパイプラインによってより高感度な散在反復配列検出ができることが知られている. 既存のソフトウェアと比較したREPriseの強みをより明確にするとともに, REPriseを取り入れたパイプラインの提案をする.
3)散在反復配列検出ソフトウェアREPriseの高速・並びに高精度化
現在REPriseはヒトゲノム長に適用するにあたり, 高感度なモードにおいては1ヶ月程度かかる. REPriseのアルゴリズムを改良することにより, より高速化しつつ, 感度と時間のトレードオフとなるパラメータについて, さらに感度を上げる方向に振ることができるようになることが期待される.

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (4 results)

All 2024 2023

All Journal Article (1 results) (of which Open Access: 1 results) Presentation (3 results)

  • [Journal Article] REPrise: De novo repeat detection using inexact seeding2024

    • Author(s)
      Atsushi Takeda, Daisuke Nonaka, Yuta Imazu, Tsukasa Fukunaga, Michiaki Hamada
    • Journal Title

      biorxiv

      Volume: -

    • DOI

      10.1101/2024.01.21.576581

    • Related Report
      2023 Research-status Report
    • Open Access
  • [Presentation] REPrise:inexact seedを用いた散在反復配列検出2023

    • Author(s)
      武田淳志,野中大輔,今津裕太,福永津嵩,浜田道昭
    • Organizer
      第46回日本分子生物学会年会
    • Related Report
      2023 Research-status Report
  • [Presentation] De novo repeat detection using inexact seed2023

    • Author(s)
      武田淳志,野中大輔,今津裕太,福永津嵩,浜田道昭
    • Organizer
      生命情報科学若手の会 第15回研究会
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフ表現による,構造変異を考慮した転移因子解析基盤の開発2023

    • Author(s)
      武田淳志,福永津嵩,浜田道昭
    • Organizer
      第21回産総研・産技連LS-BT合同研究発表会
    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-04-26   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi