研究課題/領域番号 |
19J20117
|
研究機関 | 早稲田大学 |
研究代表者 |
細田 至温 早稲田大学, 理工学術院, 特別研究員(DC1)
|
研究期間 (年度) |
2019-04-25 – 2022-03-31
|
キーワード | 確率モデル / ベイズ推定 / 機械学習 / ヒト腸内細菌叢 / メタゲノム |
研究実績の概要 |
本研究課題では、ヒト腸内細菌叢データを確率モデルによって解析し、その背後に隠された構造を明らかにすることを目的としている。2019年度においては、「確率モデルによるヒト腸内細菌叢データの局所的低次元構造の推定」に取り組んだ。ヒト腸内における細菌同士の相関関係はしばしば報告されている。このことから、各細菌の存在量を示すベクトルを各サンプルの観測点とした時、観測点は実際のデータの次元より低い次元しか持たない構造(低次元構造)を構成している可能性が高い。一方、ヒト腸内のタイプやなんらかの疾患を持つなどの特徴によって細菌同士の存在量や相関関係が異なるという報告もある。これらのことを考えると、ヒト腸内細菌叢データには局所的低次元構造が存在していることが考えられる。しかし、この局所的低次元構造は一般的なクラスタリング手法では無視されやすい。そこで、本研究ではMPPCA (Mixture of principal component analyzers) を用いてこれらの構造を推定することを提案した。本年度で行なったこととして3点挙げられる。まず1点目は公開データの収集である。今回はhttps://doi.org/10.1038/s41591-019-0458-7のデータを用いた。さらに収集したデータの基礎集計・前処理を行なった。基礎集計によりデータの傾向を把握し適切な方法を選んで前処理を行なった。2点目はパラメタ推定アルゴリズムの実装である。MPPCAのパラメタ推定の更新式を導出し実装を行なった。3点目は計算機実験の実行である。前処理したデータに対し実装したプログラムによって実験を行い結果の解釈を試みた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
結果の解釈が困難であるため。
|
今後の研究の推進方策 |
事前に決めるパラメタであるハイパーパラメタやモデルの調整を行い、よりデータに則した結果を得られるよう試みる。
|