2019 Fiscal Year Research-status Report
ヒト体内細菌叢時系列データを用いた細菌叢と疾患・健康状態の関係予測の研究
Project/Area Number |
19K20221
|
Research Institution | The University of Tokyo |
Principal Investigator |
長谷川 嵩矩 東京大学, 医科学研究所, 助教 (80753756)
|
Project Period (FY) |
2019-04-01 – 2021-03-31
|
Keywords | 統計的時系列解析 / 状態空間モデル / メタゲノム解析 / ゲノム解析 / 生命情報学 |
Outline of Annual Research Achievements |
実施計画書の通り初年度においてはまず,単一疾患だけではなく各種バイタルデータを網羅的に扱いつつ,細菌叢と疾患の関連性を解析する統計モデルの開発を実施した.既存研究として,ヒト腸内細菌叢のコンポジションデータと疾患の関連性を,latent Dirichlet allocation というモデルを用いて解析する研究が成果を挙げている.ただし,既存研究が疾患の状態を0/1の定性指標としてしか扱えないのに反して,本研究では,ヒト体内細菌叢メタゲノムのデータに留まらず,血液データなど各種バイタルデータも同時に採取しており,疾患によっては重症度という概念を組み込むことが可能である.この場合,疾患を定量的な指標として取り扱うことの出来るモデルを検討する必要がある.このため,まず疾患を定量的に扱うための指標を作成し,それを統計モデルに取り込むことを行った. 具体的には,疾患ごとに対象となる血液検査データなどを定め,ロジスティック関数などを用いて掛け合わせ,疾患確率という形で表現する方法を考案した.次に,本研究で用いたデータは,複数年度に渡って同一参加者のデータが存在し,これらを統合して利用可能にすることで,解析結果の精度を高めることが出来ることに注目した.例えば,細菌叢のデータは血液検査データと比較して非常に変わりやすく,経年変化している,もしくはしていない細菌叢を切り分けることが出来れば,結果の信憑性が高まることが推測される.本研究ではこのような同一人物の複数年度データをレプリケーションとして扱い,統計モデルに組み込めるよう,モデルの拡張を行った.この研究成果は論文として執筆中であり,学術雑誌に投稿予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本年度の研究計画としては,①単一疾患だけではなく各種バイタルデータを網羅的に扱えるように既存モデルを拡張することから始め,②これを時系列解析のモデルとして拡張すること,を実施する予定であったが,上述した通り,双方に関して予定通り研究計画を進めることが出来た.②に関しては,複数年度の健診に参加している同一人物のデータをレプリケーションとして考えることで統計モデルを作成しているが,これによって単一年度ではなく,複数年のデータを同時に解析可能になっている.また,次年度に想定していた研究計画である,ショットガンデータから得られるより詳細なゲノム情報を統合可能なモデルと方法論を確立するという点に関しても,先んじて理論的枠組みの構築を進めており,次年度の早い時期には実装されることが望まれる.このような観点から,進捗状況としては,おおむね順調に進展していると考えて良いと思われる.
|
Strategy for Future Research Activity |
次年度においては,前年度に開発されたモデルを,ショットガンデータから得られるより詳細なゲノム情報を統合可能なモデルと方法論に拡張することを実施する予定である.前年度の解析に基づいて,血液検査データや生活習慣データ,遺伝子多型情報,加えて細菌叢データを,定量化された疾患の重篤化指標に対して関連解析行うことが可能になった.本年度に実施する計画における最も困難な課題は,ショットガンデータをどのように「計算可能な形で」統計モデルに組み込むかという点である.ショットガンデータから得られる機能遺伝子のデータや細分化された細菌叢のデータは非常にスパースでありかつ多次元のデータであるため,前年度で用いた16S rRNAのデータのように利用することは計算機的に困難である.これを克服するために次年度では,まず非常に簡素なやり方として,機能遺伝子を絞った上で取り込む方法でどのような結果が出るかを検討するところから始める.次に機能遺伝子のデータをパスウェイレベルに落とし込み,観測におけるノイズを考慮可能な形のモデルに拡張した上で取り込むことを検討している.これらの結果も同様に成果をまとめた上で学術雑誌に投稿する予定である.またアプリケーションとして実社会応用が形として提供することも視野にいれている.
|