2018 Fiscal Year Research-status Report
家族性疾患解析のパラダイムシフトへ向けた全国民全ゲノム規模血縁推定基盤技術の開拓
Project/Area Number |
17K20023
|
Research Institution | The University of Tokyo |
Principal Investigator |
渋谷 哲朗 東京大学, 医科学研究所, 准教授 (60396893)
|
Project Period (FY) |
2017-06-30 – 2020-03-31
|
Keywords | アルゴリズム理論 / 個人ゲノム検索 |
Outline of Annual Research Achievements |
本研究の目的は、現在世界各国で走っている数十万人規模のゲノムプロジェクトとはさらに桁違いに大規模な、全国民規模、あるいはそれに近い規模の個人ゲノムデータベースが近い将来登場した際に、現状のデータベースの規模では不可能あるいは著しく困難な網羅的家族性遺伝性疾患解析を可能とする、まったく新しいアプローチからの新たな解析技術の開拓である。具体的には、現状技術の延長では不可能と考えられる全国民規模の超大規模個人ゲノムデータベースにもスケーラブルに対応可能な全ゲノム情報を活用する高速高精度血縁推定技術の確立をめざしている。ゲノムは個人個人で異なるが、その差異は1000塩基に1塩基程度と極めて小さい。そのため、多人数のゲノムをコンパクトに表現する手法としてゲノムグラフと呼ばれる有向グラフを作成することが多い。本年度は、その有効グラフ上のパスを高速に検索するためのコンパクトな索引構造の開発に成功した。また、そのようなゲノムグラフ上でのより高度な検索を行うためのアルゴリズム開発のためのプラットフォームの開発も行った。そのほか、これらの技術をプライバシー保護の観点からアクセスを秘匿して検索する手法に関しても調査研究を行い、一部の手法については実験検証を行った。これらの開発・調査を行った技術は、本研究が目的としている家族性疾患解析を超大規模データベース主導で網羅的に行うための必須な技術であり、今後、よりスケーラブルな解析技術・検索技術の開拓につながるものである。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
血縁推定の技術には様々なものがあるが、超大規模個人ゲノムデータベース上での血縁推定の実現のためには、それを可能とする高速演算が可能な推定技術を確立する必要がある。そのための適切な血縁推定技術の開発および本研究でめざす大規模個人ゲノムデータベース上の血縁推定プログラムのプロトタイプ作成を引き続き進めている。また、血縁推定のために重要なハプロタイプ推定を可能とするためには、ゲノムグラフ上の高速な最短路検索技術の達成が重要であることから、その最短路検索技術の開発およびそのプロトタイププログラムの作成も進めた。また、現状のゲノムデータベースは次世代シークエンサーによって解読されたデータが蓄積されているが、その精度をより高めることは、血縁推定の精度を上げるためにも重要である。そのため、本研究では、同時に、次世代シークエンサーデータの出力精度の向上技術についても研究を進めている。また、ゲノムデータベースを開発する上で、プライバシー保護も重要な課題となることから、それを強化するためのデータ構造の研究も同時並行で進めている。データアクセスを完全に秘匿するデータ構造としてORAMとよばれる技術があるが、超大規模データベースに適用するにはアクセス効率があまり高いとはいえない。そのため、アクセス効率と秘匿するセキュリティのよりバランスのとれたデータ構造の開発を進めている。
|
Strategy for Future Research Activity |
今後は、大規模血縁推定技術の確立をめざし、超高速技術血縁推定技術、超高速ハプロタイプ推定技術およびそれを可能とする最短路検索アルゴリズムの開発、それらを実際に活用するためのプライバシー保護技術基盤および、実際の家族性疾患解析にむけた学習技術の研究を多面的にさらに進めていくことで、将来の全国民規模の超大規模データベースにどのような技術が実際に必要なのかをより明らかにすることをめざし研究を進めていく。具体的には、大規模個人ゲノムデータベース上での実際の高速血縁推定技術の実装を完成するとともに、その精度、速度をスケーラビリティの面から検証を行っていく。さらに、大規模ゲノムグラフ上の最短路検索の高速化およびそれを活用したハプロタイプ・フェージング技術の確立、それを応用した家族性疾患解析技術の開発をさらに狙っていく。また、超大規模ゲノムデータベースに対しても適用可能なセキュリティとアクセス効率のバランスのとれた大規模プライバシー秘匿技術の開発を進める。そのほか、実際の家族性疾患解析にもつながる大規模学習アルゴリズムの適用可能性についても検討を行っていく。その上で、将来の国民的規模の個人ゲノムデータベース実現のための基盤となる研究の方向性をより明らかにしていく。
|
Causes of Carryover |
本年度に予定していた国際会議発表を次年度に行うことになったため、海外出張旅費1人×1回分相当額を次年度に繰り越し、使用する予定である。
|
Research Products
(2 results)