2021 Fiscal Year Research-status Report
scRNA-seq analysis using PCA and TD based unsupervised feature extraction
Project/Area Number |
20K12067
|
Research Institution | Chuo University |
Principal Investigator |
田口 善弘 中央大学, 理工学部, 教授 (30206932)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | テンソル分解 / 一細胞計測 / マルチオミックスデータ |
Outline of Annual Research Achievements |
2021年度は一細胞マルチオミックスデータの解析の論文を公表することができた. Taguchi, Y.-h.; Turki, T. Tensor-Decomposition-Based Unsupervised Feature Extraction in Single-Cell Multiomics Data Analysis. Genes 2021, 12, 1442. https://doi.org/10.3390/genes12091442 シングルセルマルチオミクスデータセットの解析は新しいトピックであり、このようなデータセットには多数の欠損値を持つ特徴が含まれているため、かなり困難な作業である。本研究では、この難題を解決するために、最近提案されたテンソル分解(TD)に基づく教師なし特徴抽出(FE)技術を実装した。この手法は、遺伝子発現、DNAメチル化、アクセシビリティからなる単一細胞のマルチオミクスデータをうまく統合することができる。最後の2つのデータは1,000万個という大きな次元を持ち、非ゼロ値の割合はわずかであるが、TDベースの教師なし特徴抽出は、欠損値を埋めずに3つのオミックスデータセットを統合することが可能である。単細胞の測定値を2次元空間に埋め込む際によく用いられるUMAPと組み合わせることで、単細胞のオミックスデータセットを統合する際に、分類と同時に2次元の埋め込みを行うことが可能である。また、TD-based unsupervised FEに基づき選択された遺伝子は、合理的な生物学的役割と有意に関連していることがわかった。 また複数の国際会議で招待講演を行うなど国際的にも高い評価を得た。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上記の様に通常の方法では難しい、大変数で欠損値が多いマルチオミックス一細胞計測データの統合解析に成功した。この様な方法は他の方法では類を見ないものであり、非常に有効であると考えられる。この他にも多数の論文を出版することに成功し、複数の国際会議で招待講演を行うなど国際的にも高い評価を得ることができた。
|
Strategy for Future Research Activity |
現在、提案手法に標準偏差の最適化を行うことで大きな改良が得られることが分かっており、そのプレプリを3報出している。Tensor decomposition and principal component analysis-based unsupervised feature extraction outperforms state-of-the-art methods when applied to histone modification profiles,Sanjiban Sekhar Roy, Y-h. Taguchi, bioRxiv 2022.04.29.490081; doi: https://doi.org/10.1101/2022.04.29.490081, Principal component analysis- and tensor decomposition-based unsupervised feature extraction to select more reasonable differentially methylated cytosines: Optimization of standard deviation versus state-of-the-art methods,Y. H. Taguchi, Turki Turki bioRxiv 2022.04.02.486807; doi: https://doi.org/10.1101/2022.04.02.486807, Tensor decomposition- and principal component analysis-based unsupervised feature extraction to select more reasonable differentially expressed genes: Optimization of standard deviation versus state-of-art methods,Y-h. Taguchi, Turki Turki,bioRxiv 2022.02.18.481115; doi: https://doi.org/10.1101/2022.02.18.481115 これらの出版を目的とする。
|
Causes of Carryover |
コロナ禍のために国際会議などに参加することが叶わず、予算消化をすることができなかった。
|
Research Products
(15 results)