2021 Fiscal Year Research-status Report
大人数の遺伝子発現データ無しで表現型と遺伝子発現の個人差の関連を調べる手法の開発
Project/Area Number |
19K20394
|
Research Institution | University of Tsukuba |
Principal Investigator |
尾崎 遼 筑波大学, 医学医療系, 准教授 (10743346)
|
Project Period (FY) |
2019-04-01 – 2023-03-31
|
Keywords | 機械学習 / 遺伝子発現 / 深層学習 |
Outline of Annual Research Achievements |
本研究では、機械学習技術を応用し、大人数の個人発現量データを必要とせずに、個々人のゲノムデータから遺伝子発現量の個人差を予測し、遺伝子発現量と表現型の関連解析を行う方法を開発し、個人から採取が困難な組織・細胞型の遺伝子発現量と表現型の関連を発見することを目指す。上記の目的を達成するために、(1) 大人数の個人発現量データを必要とせずに、個々人のゲノムデータから遺伝子発現量の個人差を予測するモデルを実装し、(2) (1) で開発された予測モデルを用いて個々人のゲノムデータから予測された遺伝子発現量に基づいて個々人の表現型と関連する遺伝子を探索するアルゴリズムを実装する、という二段階に分けて課題を遂行する。 その中で、2021年度は、本研究計画の遂行に必要なデータ、すなわち、米国NIH dbGaPに所収されているヒト個人由来のゲノムデータを所属機関において、関係部局と協議を進め、データ利用に先立ち、倫理審査委員会の承認を得るに至った。 並行して、遺伝子発現の個人差が表現型に与える影響についての知見を得るため、大規模コホートのがん組織由来バルクRNA-seqデータと少人数のがん組織由来1細胞RNA-seqデータを統合して解析することで、発現量の多寡が生存時間に影響を与えるリガンド-受容体コード遺伝子ペアを抽出する手法を考案し、膵管腺癌のデータに適用した。その結果、予後関連リガンド-受容体コード遺伝子ペアを抽出した。この成果は国際学術誌に原著論文として発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
4: Progress in research has been delayed.
Reason
NCBIのdbGaPに収載されているcontrolled accessのゲノムデータを使用する予定であるが、dbGaPへのアクセス許可申請に必要な学内責任者の許可を得た上で倫理審査委員会の承認を得るのに多大な時間を要したため、当初の予定より遅れている。
|
Strategy for Future Research Activity |
研究に使用するゲノムデータが収載されているNCBIのdbGaPへのアクセス許可申請をNIHに対して行い、ゲノムデータをダウンロードする。このデータに、開発した手法を適用し、遺伝子発現の予測の精度を予測値と実測値の比較によって評価する。
|
Causes of Carryover |
使用予定のデータ利用についてNIH dbGaPに申請を出すのに先立っての倫理審査委員会の承認を得るのに多大な時間を要した。そのため、研究計画に遅れが生じ、次年度使用額が生じた。翌年度分として請求した助成金と合わせ、ゲノムデータに、開発した手法を適用し、遺伝子発 現の予測の精度を予測値と実測値の比較によって評価し、成果を発表することに使用する予定である。
|
Research Products
(3 results)