• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

スパース経時データのクラスタリング法の開発と臨床医学への応用

研究課題

研究課題/領域番号 21K11787
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60030:統計科学関連
研究機関大阪大学 (2022-2023)
岡山大学 (2021)

研究代表者

山本 倫生  大阪大学, 大学院人間科学研究科, 准教授 (50721396)

研究期間 (年度) 2021-04-01 – 2025-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
キーワード経時測定データ / クラスタリング / 関数データ解析 / スパース経時データ
研究開始時の研究の概要

本研究では「スパース経時データに対するクラスタ構造の推定法の開発」と「遺伝子等の複数のバイオマーカーによる疾患サブタイプ探索への応用」を目的とする。具体的には、①データに内在するクラスタ構造をスパース経時データから推定可能な方法の開発、②スパース経時データに対する次元縮小を伴うクラスタリング法の開発、および③複数のデータソースを統合した手法への拡張と疾患サブタイプの探索、の3つの研究を実施する。

研究実績の概要

経時データや空間データなど、時間や位置情報に依存して滑らかに変化するデータを一般化し、「関数」として捉えたデータのことを関数データと呼ぶ。関数データの解析手法である関数データ解析は、測定機器や計算機の発達に伴って1990年代以降多くの研究がおこなわれており、近年は、関数空間上の確率解析とも結びつき、理論・応用の両面から精力的に研究されている。経時データのクラスタリングにおいて、対象ごとの測定数が極端に少ない経時データ(スパース経時データ)の場合に、背後にあるクラスタ構造を推定することが困難である。本研究では、スパースな経時データに対して適用可能なクラスタリング法の開発と、遺伝子等の複数のバイオマーカーによる疾患サブタイプ探索が可能な方法への拡張を目的としている。
スパース経時データに対して既存のクラスタリング法が機能しない大きな原因の1つは、対象ごとに測定時点が少なく、各対象の経時的な変化をデータから推定できない点にある。そこで、対象ごとの経時的な変化を推定することなく、クラスタ中心を推定するクラスタリング法を提案した。また、提案手法の理論的性質として、提案する経験損失関数は真に最適な損失関数への一致性推定量であること、および、クラスタ中心の推定量の一致性を証明することに成功した。また、既存の経時データのクラスタリング法との比較を目的として数値実験を実施し、特にサンプルサイズが小さく、かつ、測定時点数が少ないスパースな状況において、提案手法の方がより正確に背後にあるクラスタ構造を推定できることを確認した。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

スパース経時データに対するクラスタリングにおいて、対象ごとの測定数が極端に少ないスパース経時データの場合に、背後にあるクラスタ構造を推定可能な方法を数学的に定式化した。また、理論的性質として、経験損失関数の真に最適な損失関数に対する一致性とクラスタ中心の推定量の一致性を証明することに成功した。さらに、数値実験および実データの解析に基づいて、既存の経時データのクラスタリング法と比較して提案手法の方がより正確にクラスタ構造を推定できること示した。
一方で、スパースな経時測定データに対して適用可能な既存手法との比較を目的とした数値実験を実施するにあたって、既存手法の文献に記載されている内容に大きな誤りがあることが判明し、その修正のために多くの時間を費やしてしまった。なお、現在は、当該論文を修正した内容に基づいて既存手法を実装し、数値実験を終えることができた。

今後の研究の推進方策

スパース経時測定データに対するクラスタリング法の開発に成功したため、今後は、提案手法の拡張を行う。具体的には、クラスタ構造が存在する部分空間の推定を同時に行うクラスタリング法を開発する予定である。数学的な定式化や簡単な数値実験を通して手法の有用性を確認後、手法の理論的性質を検討する。なお、関数データでない通常のデータに対する部分空間とクラスタリングの同時推定法の漸近的性質の証明方法を、スパース経時測定データに対する提案手法の理論的性質の証明方法と合わせることで、新たに開発する同時推定法の漸近的性質も導出可能であると予想している。

報告書

(3件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (20件)

すべて 2023 2022 その他

すべて 国際共同研究 (2件) 雑誌論文 (3件) (うち査読あり 3件、 オープンアクセス 3件) 学会発表 (15件) (うち国際学会 3件、 招待講演 5件)

  • [国際共同研究] McGill University(カナダ)

    • 関連する報告書
      2023 実施状況報告書
  • [国際共同研究] McGill University(カナダ)

    • 関連する報告書
      2022 実施状況報告書
  • [雑誌論文] Exchangeability of Measures of Association Before and After Exposure Status Is Flipped: Its Relationship With Confounding in the Counterfactual Model2023

    • 著者名/発表者名
      Suzuki Etsuji、Yamamoto Michio、Yamamoto Eiji
    • 雑誌名

      Journal of Epidemiology

      巻: 33 号: 8 ページ: 385-389

    • DOI

      10.2188/jea.JE20210352

    • NAID

      130008143828

    • ISSN
      0917-5040, 1349-9092
    • 年月日
      2023-08-05
    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] A general explanation of the counterfactual definition of confounding2022

    • 著者名/発表者名
      Suzuki Etsuji、Yamamoto Michio、Yamamoto Eiji
    • 雑誌名

      Journal of Clinical Epidemiology

      巻: - ページ: 189-192

    • DOI

      10.1016/j.jclinepi.2022.02.002

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Clinical Utility of Germline Genetic Testing in Japanese Men Undergoing Prostate Biopsy2022

    • 著者名/発表者名
      Akamatsu Shusuke, Terada Naoki, Takata Ryo、...、Yamamoto Michio、...、Ogawa Osamu
    • 雑誌名

      JNCI Cancer Spectrum

      巻: 6 号: 1

    • DOI

      10.1093/jncics/pkac001

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] スパース経時測定データに対するクラスタリング法の漸近的性質2023

    • 著者名/発表者名
      山本倫生,寺田吉壱
    • 学会等名
      2023年度日本分類学会大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 関数データ解析に基づく経時測定データのクラスタリング2023

    • 著者名/発表者名
      山本倫生
    • 学会等名
      九州大学数理学研究院統計科学セミナー
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] A functional generalized additive model-based scan statistic for disease cluster detection2023

    • 著者名/発表者名
      Yamamoto, M., Anzai, T., Takahashi, K.
    • 学会等名
      6th International Conference on Econometrics and Statistics (EcoSta 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] スパース経時測定データに対するクラスタリング法の提案とその理論的性質2023

    • 著者名/発表者名
      山本倫生,寺田吉壱
    • 学会等名
      2023年度統計関連学会連合大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Clustering for sparsely sampled longitudinal data based on basis expansions2023

    • 著者名/発表者名
      Yamamoto, M., Terada, Y.
    • 学会等名
      14th Scientific Meeting of the Classification and Data Analysis Group (CLADAG 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 招待講演
  • [学会発表] ベクトル量子化による大規模クラスタリングの計算量削減法とその性質”2022

    • 著者名/発表者名
      寺田吉壱,山本倫生.
    • 学会等名
      日本行動計量学会 第50回大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] ベクトル量子化による大規模クラスタリングの近似法とその性質2022

    • 著者名/発表者名
      寺田吉壱,山本倫生.
    • 学会等名
      科研費シンポジウム「データサイエンスと周辺領域の双方向的理解への挑戦」
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 表点を用いた大規模クラスタリングの近似法とその性質2022

    • 著者名/発表者名
      寺田吉壱,山本倫生.
    • 学会等名
      科研費シンポジウム「大規模複雑データの理論と方法論~新たな発展と関連分野への応用~」
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 大規模・複雑なデータに対するクラスタリング法について2022

    • 著者名/発表者名
      寺田吉壱,山本倫生.
    • 学会等名
      統計数理研究所共同研究「複雑な構造をもつデータに対する多変量解析法に関する研究会」
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] スパースな経時測定データに対する関数クラスタリング2022

    • 著者名/発表者名
      山本倫生,寺田吉壱
    • 学会等名
      日本分類学会 第40回大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Causal discovery with multi-domain LiNGAM for latent factors2022

    • 著者名/発表者名
      Zeng, Y., Shimizu, S., Cai, R., Xie, F., Yamamoto, M., Hao, Z.
    • 学会等名
      Causal Analysis Workshop Series 2021 (CAWS2021)
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] 2次の重み付き一般化推定方程式を用いたデータ融合手法の提案2022

    • 著者名/発表者名
      岸本和久,山本倫生
    • 学会等名
      日本行動計量学会 第49回大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] スパースな経時測定データにおけるクラスタ構造の推定2022

    • 著者名/発表者名
      山本倫生,寺田吉壱
    • 学会等名
      日本行動計量学会 第49回大会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] Estimation of the causal effects of stochastic interventions based on sufficient dimension reduction2022

    • 著者名/発表者名
      Yamamoto, M.
    • 学会等名
      The 11th Conference of the IASC-ARS
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] Fast Approximation for large-scale clustering2022

    • 著者名/発表者名
      Terada, Y., Yamamoto, M.
    • 学会等名
      The 11th Conference of the IASC-ARS
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会 / 招待講演

URL: 

公開日: 2021-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi