2023 Fiscal Year Research-status Report
スパース経時データのクラスタリング法の開発と臨床医学への応用
Project/Area Number |
21K11787
|
Research Institution | Osaka University |
Principal Investigator |
山本 倫生 大阪大学, 大学院人間科学研究科, 准教授 (50721396)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Keywords | 経時測定データ / クラスタリング / 関数データ解析 / スパース経時データ |
Outline of Annual Research Achievements |
経時データや空間データなど、時間や位置情報に依存して滑らかに変化するデータを一般化し、「関数」として捉えたデータのことを関数データと呼ぶ。関数データの解析手法である関数データ解析は、測定機器や計算機の発達に伴って1990年代以降多くの研究がおこなわれており、近年は、関数空間上の確率解析とも結びつき、理論・応用の両面から精力的に研究されている。経時データのクラスタリングにおいて、対象ごとの測定数が極端に少ない経時データ(スパース経時データ)の場合に、背後にあるクラスタ構造を推定することが困難である。本研究では、スパースな経時データに対して適用可能なクラスタリング法の開発と、遺伝子等の複数のバイオマーカーによる疾患サブタイプ探索が可能な方法への拡張を目的としている。 スパース経時データに対して既存のクラスタリング法が機能しない大きな原因の1つは、対象ごとに測定時点が少なく、各対象の経時的な変化をデータから推定できない点にある。そこで、対象ごとの経時的な変化を推定することなく、クラスタ中心を推定するクラスタリング法を提案した。また、提案手法の理論的性質として、提案する経験損失関数は真に最適な損失関数への一致性推定量であること、および、クラスタ中心の推定量の一致性を証明することに成功した。また、既存の経時データのクラスタリング法との比較を目的として数値実験を実施し、特にサンプルサイズが小さく、かつ、測定時点数が少ないスパースな状況において、提案手法の方がより正確に背後にあるクラスタ構造を推定できることを確認した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
スパース経時データに対するクラスタリングにおいて、対象ごとの測定数が極端に少ないスパース経時データの場合に、背後にあるクラスタ構造を推定可能な方法を数学的に定式化した。また、理論的性質として、経験損失関数の真に最適な損失関数に対する一致性とクラスタ中心の推定量の一致性を証明することに成功した。さらに、数値実験および実データの解析に基づいて、既存の経時データのクラスタリング法と比較して提案手法の方がより正確にクラスタ構造を推定できること示した。 一方で、スパースな経時測定データに対して適用可能な既存手法との比較を目的とした数値実験を実施するにあたって、既存手法の文献に記載されている内容に大きな誤りがあることが判明し、その修正のために多くの時間を費やしてしまった。なお、現在は、当該論文を修正した内容に基づいて既存手法を実装し、数値実験を終えることができた。
|
Strategy for Future Research Activity |
スパース経時測定データに対するクラスタリング法の開発に成功したため、今後は、提案手法の拡張を行う。具体的には、クラスタ構造が存在する部分空間の推定を同時に行うクラスタリング法を開発する予定である。数学的な定式化や簡単な数値実験を通して手法の有用性を確認後、手法の理論的性質を検討する。なお、関数データでない通常のデータに対する部分空間とクラスタリングの同時推定法の漸近的性質の証明方法を、スパース経時測定データに対する提案手法の理論的性質の証明方法と合わせることで、新たに開発する同時推定法の漸近的性質も導出可能であると予想している。
|
Causes of Carryover |
成果の論文化のための時間を十分に確保できなかったため、その英文校正や学会等での発表費用が、計上していた金額を下回ることとなった。翌年度にそれらの 目的に使用する予定である。
|