2019 Fiscal Year Research-status Report
大人数の遺伝子発現データ無しで表現型と遺伝子発現の個人差の関連を調べる手法の開発
Project/Area Number |
19K20394
|
Research Institution | University of Tsukuba |
Principal Investigator |
尾崎 遼 筑波大学, 医学医療系, 准教授 (10743346)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 機械学習 / 遺伝子発現 / 深層学習 |
Outline of Annual Research Achievements |
本研究では、機械学習技術を応用し、大人数の個人発現量データを必要とせずに、個々人のゲノムデータから遺伝子発現量の個人差を予測し、遺伝子発現量と表現型の関連解析を行う方法を開発し、個人から採取が困難な組織・細胞型の遺伝子発現量と表現型の関連を発見することを目指す。上記の目的を達成するために、(1) 大人数の個人発現量データを必要とせずに、個々人のゲノムデータから遺伝子発現量の個人差を予測するモデルを実装し、(2) (1) で開発された予測モデルを用いて個々人のゲノムデータから予測された遺伝子発現量に基づいて個々人の表現型と関連する遺伝子を探索するアルゴリズムを実装する、という二段階に分けて課題を遂行する。 その中で、2019年度は、大人数の個人発現量データを必要とせずに、個々人のゲノムデータから遺伝子発現量の個人差を予測するステップのアルゴリズムの実装を行った。このステップにおける精度は、本研究で開発する手法全体の精度に大きく関わることから複数のアルゴリズムを実装し比較考量した。具体的には、転写開始点周辺の塩基配列から遺伝子発現量を予測するため、2種類の機械学習ベースのアルゴリズムを評価した。また、既報における精度評価指標が、目的に対して予測の部分的な評価にとどまることを見出し、新たな評価指標を導入した。これらの結果、そのうちの1つが精度よく遺伝子発現量を予測したため、採用することとした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
NCBIのdbGaPに収載されているcontrolled accessのゲノムデータを使用する予定であるが、dbGaPへのアクセス許可申請に必要な学内責任者の許可を得るのに多大な時間を要し、未だに得られていないため、当初の予定よりやや遅れている。
|
Strategy for Future Research Activity |
研究に使用するゲノムデータが収載されているNCBIのdbGaPへのアクセス許可申請を行い、ゲノムデータをダウンロードする。このデータに、開発した手法を適用し、遺伝子発現の予測の精度を予測値と実測値の比較によって評価する。
|
Causes of Carryover |
研究で使用予定のNCBIのdbGaPに収載されているcontrolled accessのゲノムデータへのアクセス許可申請が滞ったことで、研究の進捗にやや遅れが生じたため、次年度使用額が生じた。 次年度は、研究に使用するゲノムデータが収載されているNCBIのdbGaPへのアクセス許可申請を行い、ゲノムデータを入手することで研究を進捗させる。次年度使用額は、その研究成果を学会にて発表するため使用する。
|