研究課題/領域番号 |
20K21826
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
笠原 雅弘 東京大学, 大学院新領域創成科学研究科, 准教授 (60376605)
|
研究期間 (年度) |
2020-07-30 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
|
キーワード | ゲノム / 不揮発メモリー / SSD / アルゴリズム / 配列アラインメント / ゲノムデータベース / 配列検索 |
研究開始時の研究の概要 |
ゲノム情報学の分野ではテラバイト単位の大容量メモリーを搭載した高価な計算機を頻繁に用いている。高額なDNAシークエンサーと比較すると相対的に問題が少なかったが、安価なDNAシークエンサーが登場し、高価な計算機が利用出来ない環境や場面が激増している。このため、安価なDNAシークエンサーとなるべく釣り合わう比較的安価なハードウェアで動作するゲノム解析技術の開発を行い、新たな応用を可能とする。具体的には単価の安い不揮発メモリーを用いることで、より少ないDRAMで動作する各種ゲノム解析アルゴリズムの開発を目指す。
|
研究成果の概要 |
ゲノム解析の様々な場面おいて利用される配列類似性検索において、公共配列データベース上に存在する配列など検索対象データベースのサイズが非常に大きくメモリー上に検索を高速化するための索引データ構造全体を格納することができない場合には、広く一般に用いられている類似性検索ソフトウェアより高速な検索を行うためにSSDなどの大容量記憶媒体を用いた索引データ構造が利用できることを見いだした。マッチ配列長さが短い場合には確率的データ構造が有効であることを見いだした。
|
研究成果の学術的意義や社会的意義 |
DNA配列シークエンサーの発展に伴ってDNA配列解析に必要な試薬代や機器代は安くなっていくことが予想されているが、解析に必要な計算機資源を手に入れるコストはDNA配列シークエンサー関連のコスト低下ほど低下していない。 本研究により生み出された手法により、大きなデータベースに対する配列検索が従来考えられていたよりも遙かに安価なハードウェアで高速に実行できるようになった。これにより、将来的に必要となっていたゲノム解析に対する計算機資源量を減らし節約をすることができる。
|