研究課題/領域番号 |
22K12144
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 筑波大学 |
研究代表者 |
叶 秀彩 筑波大学, システム情報系, 助教 (60814001)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | feature selection / active feature selection / 特徴選択 / 中間表現 / データコラボレーション |
研究開始時の研究の概要 |
近年のデータ取得の簡易化に伴い、データは大規模・分散化している。分散管理されているデータは情報秘匿などの観点から共有が困難であり、またデータ数の不足や偏りによるリスク因子などの重要な特徴量の学習は難しくなる。重要な特徴量を学習するために,本研究では分散データの直接的な共有を行うことなく、中間表現によるデータ統合を行うことで、分散協調特徴量選択アルゴリズムを開発する。具体的には、各機関が独自に元データの抽象化を行い、抽象化されたデータ(中間表現)を同一の潜在空間に射影し、データ統合を行うことで特徴量選択のモデルを構築する。実データによる実証実験を行い、開発する特徴量選択手法の有効性を示す。
|
研究実績の概要 |
In this year, we mainly address the active feature selection-based method and application. Most existing feature selection methods focus on statically selecting the same informative features for each subtype and fail to consider the heterogeneity of samples which causes pattern differences in each subtype. We consider active feature selection to dynamically acquire different features in each subtype by combining the subtype classifier with the reinforcement learning (RL) agent in a cost-sensitive manner. We apply active feature selection for gene signature identification in renal cell carcinoma, which can select different gene signatures for different renal cell carcinoma subtypes.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
To explore different informative feature subsets for each subtype, we propose a novel active feature selection method and apply it to gene signature identification in renal cell carcinoma. By combining the subtype classifier with the reinforcement learning (RL) agent, our method can sequentially select the active features in each sample in a cost-sensitive manner. The application for gene signature identification in renal cell carcinoma show that our method can select different gene signatures for different renal cell carcinoma subtypes.
|
今後の研究の推進方策 |
Next step, we will further consider distributed datasets. We will propose distributed collaborative feature learning methods and consider privacy preserving. Intermediate representation based methods and federated learning will be applied to design the distributed feature selection framework for data collaboration. We also consider to apply our method to distributed multi-view datasets for multi-view data collaboration.
|