研究実績の概要 |
2021年度は一細胞マルチオミックスデータの解析の論文を公表することができた. Taguchi, Y.-h.; Turki, T. Tensor-Decomposition-Based Unsupervised Feature Extraction in Single-Cell Multiomics Data Analysis. Genes 2021, 12, 1442. https://doi.org/10.3390/genes12091442 シングルセルマルチオミクスデータセットの解析は新しいトピックであり、このようなデータセットには多数の欠損値を持つ特徴が含まれているため、かなり困難な作業である。本研究では、この難題を解決するために、最近提案されたテンソル分解(TD)に基づく教師なし特徴抽出(FE)技術を実装した。この手法は、遺伝子発現、DNAメチル化、アクセシビリティからなる単一細胞のマルチオミクスデータをうまく統合することができる。最後の2つのデータは1,000万個という大きな次元を持ち、非ゼロ値の割合はわずかであるが、TDベースの教師なし特徴抽出は、欠損値を埋めずに3つのオミックスデータセットを統合することが可能である。単細胞の測定値を2次元空間に埋め込む際によく用いられるUMAPと組み合わせることで、単細胞のオミックスデータセットを統合する際に、分類と同時に2次元の埋め込みを行うことが可能である。また、TD-based unsupervised FEに基づき選択された遺伝子は、合理的な生物学的役割と有意に関連していることがわかった。 また複数の国際会議で招待講演を行うなど国際的にも高い評価を得た。
|
今後の研究の推進方策 |
現在、提案手法に標準偏差の最適化を行うことで大きな改良が得られることが分かっており、そのプレプリを3報出している。Tensor decomposition and principal component analysis-based unsupervised feature extraction outperforms state-of-the-art methods when applied to histone modification profiles,Sanjiban Sekhar Roy, Y-h. Taguchi, bioRxiv 2022.04.29.490081; doi: https://doi.org/10.1101/2022.04.29.490081, Principal component analysis- and tensor decomposition-based unsupervised feature extraction to select more reasonable differentially methylated cytosines: Optimization of standard deviation versus state-of-the-art methods,Y. H. Taguchi, Turki Turki bioRxiv 2022.04.02.486807; doi: https://doi.org/10.1101/2022.04.02.486807, Tensor decomposition- and principal component analysis-based unsupervised feature extraction to select more reasonable differentially expressed genes: Optimization of standard deviation versus state-of-art methods,Y-h. Taguchi, Turki Turki,bioRxiv 2022.02.18.481115; doi: https://doi.org/10.1101/2022.02.18.481115 これらの出版を目的とする。
|