研究課題/領域番号 |
23K11013
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 慶應義塾大学 |
研究代表者 |
林 賢一 慶應義塾大学, 理工学部(矢上), 准教授 (70617274)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2026年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | ロバスト推定 / べき密度ダイバージェンス / 二値回帰モデル / MCC / マシューズ相関係数 / 不均衡データ / 医学統計学 / 生物統計 / 機械学習 / 統計科学 |
研究開始時の研究の概要 |
本研究の目的は,不均衡データの諸解析法の統合的理解と,その生存時間解析への発展的応用である.不均衡データにおける主な問題は,比率の小さいクラスの情報がモデルの推測・評価に寄与しにくいことと,推定された統計モデルが不安定になりやすいことである.本研究では,これらの問題を克服するために提案されている方法を,統一的な視点から理解できるようにすることを目指す.通常,不均衡データは応答変数が二値(または多値)の回帰モデルに対するデータのことであるが,本研究ではこれらに対する方法を生存時間を応答変数とする回帰モデルに対して適用することも目指す.
|
研究実績の概要 |
本研究の目的は,不均衡データに対する諸解析法を統合的に理解するための枠組みを構築することと,その知見を生存時間解析へ発展的に応用することである.初年度である2023年度は,ロバストなダイバージェンスと判別超平面の推定に関する研究を実施した.その結果,ある特殊な場合のべき密度ダイバージェンスについて,Brierスコアとの関連とが見いだされ,さらにクラスの分離に関する重要な性質をもつことがわかった.これは最尤法(カルバック・ライブラーダイバージェンスによる推定)にはない性質である.この結果について現在論文を執筆中である. また,MCC(マシューズ相関係数)に関する統計的推測の研究も実施した.MCCは二値の反応に対する診断の精度に関する指標であり,不均衡データの場合に有用であることが期待される.このMCCの漸近分布を,単純なデルタ法による近似とFisherのz変換を利用した近似という二つのアプローチによって導出し,これらを数値的に比較した.また,対応のあるMCCの差についても同様の解析を行った.この場合は前述の状況とは異なり,Fisherのz変換のような適当な全単射が存在しない.そのため,Zou (2007)などのアプローチを援用し,漸近分布を導出した.この研究については論文を執筆し,学術雑誌へ投稿した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ロバストなダイバージェンスと二値回帰モデルにおけるBrierスコアの関係を見出したことと,これの特殊な性質を明らかにしたことは十分な進展であるといえる.MCCに関する研究も並行して実施できたことも考慮すると,進捗はおおむね順調であるといえる.
|
今後の研究の推進方策 |
ロバストなダイバージェンスとその他の損失関数に関する関連をより深く追及する.とくに,サンプリングに基づく方法との関連が興味深いと考えられる.
|