研究課題/領域番号 |
17K12648
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
統計科学
|
研究機関 | 岡山大学 |
研究代表者 |
山本 倫生 岡山大学, 環境生命科学学域, 准教授 (50721396)
|
研究期間 (年度) |
2017-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2017年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | クラスタリング / 次元縮小 / 判別分析 / 部分最小二乗回帰 / 統計科学 / 符号化 / 多変量解析 |
研究成果の概要 |
複数の目的変数の特徴を反映したクラスター構造の予測を、ある説明変数群によって行うことを目的とする状況を考える。そのような場合、一般には、まず目的変数だけをデータとしてクラスター分析を適用し、目的変数間に内在するクラスター構造を抽出する。続いて、それをラベルとして、説明変数を用いた予測式の推定を行うことが多い。本研究では、このような従来の逐次的な方法ではなく、目的変数のクラスター構造の抽出と、説明変数によるそのクラスターラベルの予測を同時に行う方法を提案した。提案方法を用いることにより、取り扱っている現象に関連の強いクラスター構造が得られることが期待される。
|
研究成果の学術的意義や社会的意義 |
臨床医学における典型的な研究として、まず(1)クラスター分析などの教師なし学習により、疾患の重症度などを用いて症例のクラスタリングを行い、次に(2)得られたクラスターをラベルとして判別分析などの教師あり学習を用い、バイオマーカーによるサブタイプの予測や予測に重要なバイオマーカーの特定を行うものがある。このようなアプローチでは、段階ごとに異なる目的関数の最適化を行うため、真のクラスター構造と、それを予測可能な説明変数群の特定に失敗してしまう。本研究では、この問題を解決するために、教師なし学習と教師あり学習の両方の目的を同時に達成するための新たな統計解析の枠組みを提案することとなる。
|