2019 Fiscal Year Annual Research Report
Project/Area Number |
19J20117
|
Research Institution | Waseda University |
Principal Investigator |
細田 至温 早稲田大学, 理工学術院, 特別研究員(DC1)
|
Project Period (FY) |
2019-04-25 – 2022-03-31
|
Keywords | 確率モデル / ベイズ推定 / 機械学習 / ヒト腸内細菌叢 / メタゲノム |
Outline of Annual Research Achievements |
本研究課題では、ヒト腸内細菌叢データを確率モデルによって解析し、その背後に隠された構造を明らかにすることを目的としている。2019年度においては、「確率モデルによるヒト腸内細菌叢データの局所的低次元構造の推定」に取り組んだ。ヒト腸内における細菌同士の相関関係はしばしば報告されている。このことから、各細菌の存在量を示すベクトルを各サンプルの観測点とした時、観測点は実際のデータの次元より低い次元しか持たない構造(低次元構造)を構成している可能性が高い。一方、ヒト腸内のタイプやなんらかの疾患を持つなどの特徴によって細菌同士の存在量や相関関係が異なるという報告もある。これらのことを考えると、ヒト腸内細菌叢データには局所的低次元構造が存在していることが考えられる。しかし、この局所的低次元構造は一般的なクラスタリング手法では無視されやすい。そこで、本研究ではMPPCA (Mixture of principal component analyzers) を用いてこれらの構造を推定することを提案した。本年度で行なったこととして3点挙げられる。まず1点目は公開データの収集である。今回はhttps://doi.org/10.1038/s41591-019-0458-7のデータを用いた。さらに収集したデータの基礎集計・前処理を行なった。基礎集計によりデータの傾向を把握し適切な方法を選んで前処理を行なった。2点目はパラメタ推定アルゴリズムの実装である。MPPCAのパラメタ推定の更新式を導出し実装を行なった。3点目は計算機実験の実行である。前処理したデータに対し実装したプログラムによって実験を行い結果の解釈を試みた。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
結果の解釈が困難であるため。
|
Strategy for Future Research Activity |
事前に決めるパラメタであるハイパーパラメタやモデルの調整を行い、よりデータに則した結果を得られるよう試みる。
|