本年度は、昨年度に完成させた情報幾何を用いた細胞集団プロファイルからの特徴量抽出手法である拡大指数型分布族分解法(Decomposition into Extended Exponential family: DEEF法)の理論、応用の両面でのさらなる研究を行った。理論面では、DEEF法は比較的少ないマーカー数までしか対応できないことが課題であったが、その課題を克服し、1細胞RNA-seqデータなどの高次元1細胞発現データにも対応可能なように手法を拡張したkernel DEEF法を開発した。さらにこの手法を用いて、サイトメトリーデータを機械学習で分類するワークフローを開発し、実データを用いてパフォーマンスなどの検討を行った。さらに、single cell RNA-seq dataに対してもこの手法を適用し、高次元single cell RNA-seq dataのサンプル同士の異同定量が行えることを示した。応用面では、DEEF法のエピゲノムデータの異同定量への利用を検討し、公共エピゲノムデータセットを用いた解析を行い、国内学会での発表を行った。さらに、大規模サイトメトリーデータとゲノムデータを組み合わせたゲノム疫学解析においても進展があった。独自のワークフローを用いてサイトメトリーデータからリンパ球の細胞集団プロファイルの特徴量の抽出を行い、抽出した特徴量に対してゲノムワイド関連解析を実施し、リンパ球プロファイルの状態の個人差に関連する一塩基多型を国際学術雑誌で報告した。
|