研究課題/領域番号 |
20H04243
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 沖縄科学技術大学院大学 (2023) 京都大学 (2020-2022) |
研究代表者 |
山田 誠 沖縄科学技術大学院大学, 機械学習とデータ科学ユニット, 准教授 (00581323)
|
研究分担者 |
下平 英寿 京都大学, 情報学研究科, 教授 (00290867)
POIGNARD BENJAMIN 大阪大学, 大学院経済学研究科, 准教授 (40845252)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,680千円 (直接経費: 13,600千円、間接経費: 4,080千円)
2023年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2022年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2020年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
|
キーワード | 選択的推論 / 特徴選択 / 電子透かし / カーネル法 / 木構造最適輸送距離 / 統計的推論 / 機械学習 |
研究開始時の研究の概要 |
バイオロジーや医療分野においては, 特徴数 (例:遺伝子数) が標本数 (例:患者数) よりも大きい高次元 小標本データの解析が重要テーマの一つである. 本研究課題では, 選択的推論 (Selective Inference)と 呼ばれる特徴選択と統計的仮説検定を組み合わせた方法の研究開発を実施する. 具体的には, 研究代 表者らが独自に研究を進めているカーネル法に基づいた非線形選択的推論の枠組みを高次元小標本 データを扱えるように拡張することを目指す. さらに, 提案アルゴリズムを急性骨髄性白血病やアト ピー性皮膚炎といった現実の問題に適用しその有効性を示すことを目的とする.
|
研究成果の概要 |
本研究では、非線形選択的推論の高次元拡張に取り組んだ. 2020年度は、HSIC LassoとSplit法を用いた統計的仮説検定方法を開発し, 実データで有効性を示した. 2021年度は、Polyhedral LemmaとKnockoff filterを適用したHSICに基づく手法を提案し, それぞれICML 2021とAISTATS 2022で報告した. 2022年度は, 最適輸送法に基づく新たな高次元データ解析手法を提案し、AISTATS 2022とTMLRで発表した. そして最終年度は, Distance Covariance Lasso法を提案し、選択的推論の理論的性質を示した.
|
研究成果の学術的意義や社会的意義 |
本研究は、非線形選択的推論を高次元データに適用する新たな手法を提案し, 統計的仮説検定の検出力向上を目指した. さらに, 木構造最適輸送に基づくBarycenterの推定手法やWasserstein距離の学習方法など, 新たな高次元データ解析手法を開発した. つまり, 我々は非線形データの特徴選択とスクリーニングの理論的基盤を確立したと言える. さらに今後, 機械学習やバイオインフォマティクス分野での実用的な応用され, 提案法による新規の科学的発見が期待できる. これらの成果は、学術的意義に加え、社会的にも広範な影響を与えると考える.
|