研究実績の概要 |
本年度は、前年度でその有効性を確認した低次元化の手法に関して、より包括的に検討を進めた。 まずシークエンス間の距離を定量化する際に用いるSmith-Waterman Algorithmでは、置換や欠損などのコストを表すパラメータに依存してその結果が変わりうる。幾つかの代表的なパラメータを試し、適切なパラメータの探索を行った。次に、低次元化の方法として多次元尺度法(MDS)のみならず、t-SNE, Spectral Embedding(SE)、Isomapなども検討を重ね、MDSおよびt-SNEが、サンプル間のクラスタ構造の再現性などの観点から、よい性質をもつことを見出した。また、低次元埋め込みデータの分布をカーネル密度法で推定する際のパラメータ推定法などの検討を行った。そして、ブートストラップ法などによって、得られたサンプル間関係の統計的有意性を評価した。これらの結果をまとめ、プレプリントをbioXivに公開した。 並行して、本手法をより現実的で大きなデータセットに適用し、その有効性を検討するために、新たにマウスTCRレパトアのシーケンス解析を行い、その解析を進めた。また最近公開されたヒトのレパトアデータなどへも解析方法を試し、予備的ではあるが先行する手法と比べて、データの高次元性・スパース性に起因する問題をうまく回避して、安定なサンプルの比較ができていることを確認した。
|