• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実施状況報告書

スパース経時データのクラスタリング法の開発と臨床医学への応用

研究課題

研究課題/領域番号 21K11787
研究機関岡山大学

研究代表者

山本 倫生  岡山大学, 環境生命科学学域, 准教授 (50721396)

研究期間 (年度) 2021-04-01 – 2025-03-31
キーワード経時測定データ / クラスタリング / 関数データ解析 / スパース経時データ
研究実績の概要

経時データや空間データなど、時間や位置情報に依存して滑らかに変化するデータを一般化し、「関数」として捉えたデータのことを関数データと呼ぶ。関数データの解析手法である関数データ解析は、測定機器や計算機の発達に伴って1990年代以降多くの研究がおこなわれており、近年は、関数空間上の確率解析とも結びつき、理論・応用の両面から精力的に研究されている。経時データのクラスタリングにおいて、対象ごとの測定数が極端に少ない経時データ(スパース経時データ)の場合に、背後にあるクラスタ構造を推定することが困難である。本研究では、スパースな経時データに対して適用可能なクラスタリング法の開発と、遺伝子等の複数のバイオマーカーによる疾患サブタイプ探索が可能な方法への拡張を目的としている。
スパース経時データに対して既存のクラスタリング法が機能しない大きな原因の1つは、対象ごとに測定時点が少なく、各対象の経時的な変化をデータから推定できない点にある。そこで、対象ごとの経時的な変化を推定することなく、クラスタ中心を推定するクラスタリング法を提案した。提案する損失関数は、古典的なK-means法の損失関数の経時データの場合への自然な拡張とみなすことができる。提案手法の理論的性質として、経験損失関数は真に最適な損失関数への一致性推定量であることを示した。また、既存の経時データのクラスタリング法との比較を数値実験によって行い、提案手法の方がより正確に背後にあるクラスタ構造を推定できることを確認した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究実施計画として想定していた通り、スパース経時データに対するクラスタリングにおいて、対象ごとの測定数が極端に少ないスパース経時データの場合に、背後にあるクラスタ構造を推定可能な方法を定式化した。また、提案手法の理論的性質として、経験損失関数の真に最適な損失関数に対する一致性を証明した。さらに、数値実験により、既存の経時データのクラスタリング法と比較して提案手法の方がより正確にクラスタ構造を推定できること示した。

今後の研究の推進方策

提案手法の理論的性質についてさらに検討する予定である。具体的には、損失関数だけではなく、クラスタ中心の推定量が真に最適なクラスタ中心に対して一致性を持つかどうかを検討する。また、非漸近的な理論的性質として、損失関数の平均二乗誤差に対する大偏差不等式の導出も検討する。数値実験に加えて、実際のデータを利用した解析を行い、提案手法の有用性を示す。さらに、提案手法の損失関数を拡張することにより、クラスタ構造が存在する部分空間の推定を同時に行うクラスタリング法を開発する予定である。

次年度使用額が生じた理由

コロナ禍により、研究成果を発表する予定だった学会大会への現地参加ができず、旅費として計上していた金額を下回ることとなった。翌年度に開催予定の学会大会への旅費として使用する予定である。

  • 研究成果

    (9件)

すべて 2022

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (6件) (うち国際学会 3件、 招待講演 2件)

  • [雑誌論文] A general explanation of the counterfactual definition of confounding2022

    • 著者名/発表者名
      Suzuki Etsuji、Yamamoto Michio、Yamamoto Eiji
    • 雑誌名

      Journal of Clinical Epidemiology

      巻: - ページ: -

    • DOI

      10.1016/j.jclinepi.2022.02.002

    • 査読あり
  • [雑誌論文] Exchangeability of measures of association before and after exposure status is flipped: its relationship with confounding in the counterfactual model2022

    • 著者名/発表者名
      Suzuki Etsuji、Yamamoto Michio、Yamamoto Eiji
    • 雑誌名

      Journal of Epidemiology

      巻: - ページ: -

    • DOI

      10.2188/jea.JE20210352

    • 査読あり
  • [雑誌論文] Clinical Utility of Germline Genetic Testing in Japanese Men Undergoing Prostate Biopsy2022

    • 著者名/発表者名
      Akamatsu Shusuke、...、Yamamoto Michio、...、Ogawa Osamu
    • 雑誌名

      JNCI Cancer Spectrum

      巻: 6 ページ: -

    • DOI

      10.1093/jncics/pkac001

    • 査読あり
  • [学会発表] スパースな経時測定データに対する関数クラスタリング2022

    • 著者名/発表者名
      山本倫生,寺田吉壱
    • 学会等名
      日本分類学会 第40回大会
  • [学会発表] Causal discovery with multi-domain LiNGAM for latent factors2022

    • 著者名/発表者名
      Zeng, Y., Shimizu, S., Cai, R., Xie, F., Yamamoto, M., Hao, Z.
    • 学会等名
      Causal Analysis Workshop Series 2021 (CAWS2021)
    • 国際学会
  • [学会発表] 2次の重み付き一般化推定方程式を用いたデータ融合手法の提案2022

    • 著者名/発表者名
      岸本和久,山本倫生
    • 学会等名
      日本行動計量学会 第49回大会
  • [学会発表] スパースな経時測定データにおけるクラスタ構造の推定2022

    • 著者名/発表者名
      山本倫生,寺田吉壱
    • 学会等名
      日本行動計量学会 第49回大会
  • [学会発表] Estimation of the causal effects of stochastic interventions based on sufficient dimension reduction2022

    • 著者名/発表者名
      Yamamoto, M.
    • 学会等名
      The 11th Conference of the IASC-ARS
    • 国際学会 / 招待講演
  • [学会発表] Fast Approximation for large-scale clustering2022

    • 著者名/発表者名
      Terada, Y., Yamamoto, M.
    • 学会等名
      The 11th Conference of the IASC-ARS
    • 国際学会 / 招待講演

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi