研究課題/領域番号 |
21K11787
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 大阪大学 (2022) 岡山大学 (2021) |
研究代表者 |
山本 倫生 大阪大学, 大学院人間科学研究科, 准教授 (50721396)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2021年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 経時測定データ / クラスタリング / 関数データ解析 / スパース経時データ |
研究開始時の研究の概要 |
本研究では「スパース経時データに対するクラスタ構造の推定法の開発」と「遺伝子等の複数のバイオマーカーによる疾患サブタイプ探索への応用」を目的とする。具体的には、①データに内在するクラスタ構造をスパース経時データから推定可能な方法の開発、②スパース経時データに対する次元縮小を伴うクラスタリング法の開発、および③複数のデータソースを統合した手法への拡張と疾患サブタイプの探索、の3つの研究を実施する。
|
研究実績の概要 |
経時データや空間データなど、時間や位置情報に依存して滑らかに変化するデータを一般化し、「関数」として捉えたデータのことを関数データと呼ぶ。関数データの解析手法である関数データ解析は、測定機器や計算機の発達に伴って1990年代以降多くの研究がおこなわれており、近年は、関数空間上の確率解析とも結びつき、理論・応用の両面から精力的に研究されている。経時データのクラスタリングにおいて、対象ごとの測定数が極端に少ない経時データ(スパース経時データ)の場合に、背後にあるクラスタ構造を推定することが困難である。本研究では、スパースな経時データに対して適用可能な、関数データ解析のアプローチによるクラスタリング法の開発と、遺伝子等の複数のバイオマーカーによる疾患サブタイプ探索が可能な方法への拡張を目的としている。 スパース経時データに対して既存のクラスタリング法が機能しない大きな原因の1つは、対象ごとに測定時点が少なく、各対象の経時的な変化をデータから推定できない点にある。そこで、対象ごとの経時的な変化を推定することなく、クラスタ中心を推定するクラスタリング法を提案していた。また、提案手法の理論的性質として、経験損失関数は真に最適な損失関数への一致性推定量であることを示した。さらに、クラスタ中心の推定量の一致性を証明することに成功した。また、既存の経時データのクラスタリング法との比較を実データをもとに行い、提案手法の方がより正確に背後にあるクラスタ構造を推定できることを確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
スパース経時データに対するクラスタリングにおいて、対象ごとの測定数が極端に少ないスパース経時データの場合に、背後にあるクラスタ構造を推定可能な方法を数学的に定式化した。また、理論的性質として、経験損失関数の真に最適な損失関数に対する一致性を証明するだけでなく、クラスタ中心の推定量の一致性も証明することに成功した。さらに、実データの解析に基づいて、既存の経時データのクラスタリング法と比較して提案手法の方がより正確にクラスタ構造を推定できること示した。
|
今後の研究の推進方策 |
スパース経時測定データに対するクラスタリング法の開発に成功したため、今後は、提案手法の拡張を行う。具体的には、クラスタ構造が存在する部分空間の推定を同時に行うクラスタリング法を開発する予定である。数学的な定式化や簡単な数値実験を通して手法の有用性を確認後、手法の理論的性質を検討する。例えば、2023年度までに開発していたクラスタリング手法での検討結果を参考に、損失関数および推定量の一致性を証明する。
|