Project/Area Number |
23K11013
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Keio University |
Principal Investigator |
林 賢一 慶應義塾大学, 理工学部(矢上), 准教授 (70617274)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2026: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
|
Keywords | ロバスト推定 / べき密度ダイバージェンス / 二値回帰モデル / MCC / マシューズ相関係数 / 不均衡データ / 医学統計学 / 生物統計 / 機械学習 / 統計科学 |
Outline of Research at the Start |
本研究の目的は,不均衡データの諸解析法の統合的理解と,その生存時間解析への発展的応用である.不均衡データにおける主な問題は,比率の小さいクラスの情報がモデルの推測・評価に寄与しにくいことと,推定された統計モデルが不安定になりやすいことである.本研究では,これらの問題を克服するために提案されている方法を,統一的な視点から理解できるようにすることを目指す.通常,不均衡データは応答変数が二値(または多値)の回帰モデルに対するデータのことであるが,本研究ではこれらに対する方法を生存時間を応答変数とする回帰モデルに対して適用することも目指す.
|
Outline of Annual Research Achievements |
本研究の目的は,不均衡データに対する諸解析法を統合的に理解するための枠組みを構築することと,その知見を生存時間解析へ発展的に応用することである.初年度である2023年度は,ロバストなダイバージェンスと判別超平面の推定に関する研究を実施した.その結果,ある特殊な場合のべき密度ダイバージェンスについて,Brierスコアとの関連とが見いだされ,さらにクラスの分離に関する重要な性質をもつことがわかった.これは最尤法(カルバック・ライブラーダイバージェンスによる推定)にはない性質である.この結果について現在論文を執筆中である. また,MCC(マシューズ相関係数)に関する統計的推測の研究も実施した.MCCは二値の反応に対する診断の精度に関する指標であり,不均衡データの場合に有用であることが期待される.このMCCの漸近分布を,単純なデルタ法による近似とFisherのz変換を利用した近似という二つのアプローチによって導出し,これらを数値的に比較した.また,対応のあるMCCの差についても同様の解析を行った.この場合は前述の状況とは異なり,Fisherのz変換のような適当な全単射が存在しない.そのため,Zou (2007)などのアプローチを援用し,漸近分布を導出した.この研究については論文を執筆し,学術雑誌へ投稿した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ロバストなダイバージェンスと二値回帰モデルにおけるBrierスコアの関係を見出したことと,これの特殊な性質を明らかにしたことは十分な進展であるといえる.MCCに関する研究も並行して実施できたことも考慮すると,進捗はおおむね順調であるといえる.
|
Strategy for Future Research Activity |
ロバストなダイバージェンスとその他の損失関数に関する関連をより深く追及する.とくに,サンプリングに基づく方法との関連が興味深いと考えられる.
|