本研究課題では、ヒト腸内細菌叢データを確率モデルによって解析し、その背後に隠された構造を明らかにすることを目的としている。2021年度では、「細菌叢データにおける系統樹に基づいた回帰のための確率モデルの開発」に取り組んだ。細菌叢データを使った回帰分析は広く行われている。特に、ヒト腸内細菌叢データの解析においては細菌と疾患との関連を調べるため重要な分析の一つとなっている。一方で、回帰分析に用いる細菌の分類階級を決定する標準的な方法は存在しない。分類階級とは、その生物の系統的な分類の粒度を示し、目・科・属などがこれに当たる。この問題に対し、情報量基準ベースの手法や、L1正則化ベースの手法が提案されてきた。しかしながら、推定した分類の不確実性を表現できない、系統樹が成り立たない推定を行ってしまうなどの問題があった。本研究では、確率モデルを用いてこれらの粒度を各系統について自動的に決定する回帰モデルを提案した。本手法では先述の問題を解決することができる。本年度で行ったこととしては、三点挙げられる。一点目は先行研究のサーベイおよび本手法の差別化、二点目は提案手法の実装およびナイーブな手法との比較、三点目は学会発表である。ナイーブな手法との比較では本手法の有効性が示された。これらの結果を2021年日本バイオインフォマティクス学会年会・第10回生命医薬情報学連合大会(IIBMP2021)において発表した。
|