研究課題/領域番号 |
20K21827
|
研究機関 | 東京大学 |
研究代表者 |
渋谷 哲朗 東京大学, 医科学研究所, 教授 (60396893)
|
研究期間 (年度) |
2020-07-30 – 2023-03-31
|
キーワード | アルゴリズム理論 / 個人ゲノム / プライバシー / 検索技術 / グラフ理論 |
研究実績の概要 |
ゲノム研究は善意の提供者個人の究極の個人データを用いて行う研究であるが、多くのデータ提供者は提供データを最大限活用して最大限の成果を上げることを希望している。本研究の目的は大規模個人ゲノムデータに対し、究極の個人情報ともいわれるゲノムデータの倫理的特性に合致した安全かつ効率的な検索・解析手法を実現することである。その実現のために、様々なデータを複雑に表現できるグラフ構造を活用し、必要なデータを保持しつつ匿名化を行うグラフ匿名化とよぶ手法の確立をめざしている。特に複数ゲノムをコンパクトに表現する技術として、ゲノムグラフとよばれる技術があり、このゲノムグラフを拡張することによってこれらを実現するとともに、匿名化データに対する検索・解析技術の開発も行っていくことをめざしている。本年度は、前年度に引き続き、、ゲノムグラフの新たな効率的表現をグラフ理論を活用して圧縮表現する技術の研究を行い、新たな技術開発に成功した。また、データベース公開の際のプライバシー保護技術として、χ2統計量やコクラン・アーミテージ統計量などゲノムワイド関連解析における多くの基盤的統計値に対し差分プライバシーを活用したゲノム統計値公開手法を開発することに成功した。またTDT統計量の公開を高速に計算する手法の開発にも成功した。また、それらの統計値から上位のものを公開する際のより高精度な公開手法の開発にも成功した。また、医療情報からグラフ情報を抽出する技術として重要な支援言語技術の開発も進めた。今後はこれらの技術を統合し、実際のグラフ匿名化技術の開発に向けてさらに研究を進めていく。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
グラフ理論を活用した個人ゲノムデータ表現法の開発・実装に成功した。また、グラフ情報の公開の際に必要となるプライバシー保護技術についても開発・実装に成功している。また、関連して、グラフ匿名化の実現の関連基盤技術となりえる自然言語処理技術、wear leveling技術などの開発にも成功した。
|
今後の研究の推進方策 |
これまでに成功したゲノムグラフの新たな効率的表現をグラフ理論を活用して圧縮表現する技術および、差分プライバシーを活用したゲノム統計値公開手法を活用し、実際のデータのグラフ匿名化技法の開発を狙っていく。それと同時に、それらの技術とあわせて実際の個人ゲノムのプライバシー保護を強化することができる新たな技術の開発に引き続き取り組んでいく。また、ゲノム情報だけではなく、カルテ情報など異なる構造を持つデータの匿名化に関しても研究を進める。
|
次年度使用額が生じた理由 |
新型コロナウィルスによる研究環境の激変により、予定していた学会参加、研究打ち合わせなどがキャンセルとなり旅費の支出がなくなったこと、また研究遂行方法の環境への適応のため、物品購入も次年度へと伸ばすなどしたため、今年度の支出が予定よりも少なくなった。最終年度はコロナの状況に応じて柔軟に研究活動を進めていき、物品購入、人件費等を適切に使用する予定である。
|