• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

不均衡データに対する解析法の統合的理解と生存時間解析への発展的応用

Research Project

Project/Area Number 23K11013
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 60030:Statistical science-related
Research InstitutionKeio University

Principal Investigator

林 賢一  慶應義塾大学, 理工学部(矢上), 准教授 (70617274)

Project Period (FY) 2023-04-01 – 2027-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2026: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2023: ¥2,600,000 (Direct Cost: ¥2,000,000、Indirect Cost: ¥600,000)
Keywordsロバスト推定 / べき密度ダイバージェンス / 二値回帰モデル / MCC / マシューズ相関係数 / 不均衡データ / 医学統計学 / 生物統計 / 機械学習 / 統計科学
Outline of Research at the Start

本研究の目的は,不均衡データの諸解析法の統合的理解と,その生存時間解析への発展的応用である.不均衡データにおける主な問題は,比率の小さいクラスの情報がモデルの推測・評価に寄与しにくいことと,推定された統計モデルが不安定になりやすいことである.本研究では,これらの問題を克服するために提案されている方法を,統一的な視点から理解できるようにすることを目指す.通常,不均衡データは応答変数が二値(または多値)の回帰モデルに対するデータのことであるが,本研究ではこれらに対する方法を生存時間を応答変数とする回帰モデルに対して適用することも目指す.

Outline of Annual Research Achievements

本研究の目的は,不均衡データに対する諸解析法を統合的に理解するための枠組みを構築することと,その知見を生存時間解析へ発展的に応用することである.初年度である2023年度は,ロバストなダイバージェンスと判別超平面の推定に関する研究を実施した.その結果,ある特殊な場合のべき密度ダイバージェンスについて,Brierスコアとの関連とが見いだされ,さらにクラスの分離に関する重要な性質をもつことがわかった.これは最尤法(カルバック・ライブラーダイバージェンスによる推定)にはない性質である.この結果について現在論文を執筆中である.
また,MCC(マシューズ相関係数)に関する統計的推測の研究も実施した.MCCは二値の反応に対する診断の精度に関する指標であり,不均衡データの場合に有用であることが期待される.このMCCの漸近分布を,単純なデルタ法による近似とFisherのz変換を利用した近似という二つのアプローチによって導出し,これらを数値的に比較した.また,対応のあるMCCの差についても同様の解析を行った.この場合は前述の状況とは異なり,Fisherのz変換のような適当な全単射が存在しない.そのため,Zou (2007)などのアプローチを援用し,漸近分布を導出した.この研究については論文を執筆し,学術雑誌へ投稿した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

ロバストなダイバージェンスと二値回帰モデルにおけるBrierスコアの関係を見出したことと,これの特殊な性質を明らかにしたことは十分な進展であるといえる.MCCに関する研究も並行して実施できたことも考慮すると,進捗はおおむね順調であるといえる.

Strategy for Future Research Activity

ロバストなダイバージェンスとその他の損失関数に関する関連をより深く追及する.とくに,サンプリングに基づく方法との関連が興味深いと考えられる.

Report

(1 results)
  • 2023 Research-status Report
  • Research Products

    (4 results)

All 2023

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 2 results) Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] Micro-Internal Short Circuit Detection in Lithium-Ion Batteries Based on <i>k</i>-Nearest Neighbor Method2023

    • Author(s)
      志村 重輔、林 沙織、岡安 悟志、板垣 昌幸、林 賢一
    • Journal Title

      Bulletin of Data Analysis of Japanese Classification Society

      Volume: 12 Issue: 1 Pages: 1-15

    • DOI

      10.32146/bdajcs.12.1

    • ISSN
      2186-4195, 2434-3382
    • Year and Date
      2023-09-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Model Selection with Missing Data Embedded in Missing-at-Random Data2023

    • Author(s)
      Takai Keiji、Hayashi Kenichi
    • Journal Title

      Stats

      Volume: 6 Issue: 2 Pages: 495-505

    • DOI

      10.3390/stats6020031

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] Asymptotic properties of the Matthews correlation coefficient2023

    • Author(s)
      Yuki Itaya, Jun Tamura, Kenichi Hayashi, Kouji Yamamoto
    • Organizer
      The 8th Japanese-German Symposium on Classification
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] 生存-経時同時モデルに対する異質な部分集団への再帰分割法2023

    • Author(s)
      名取京太朗,林賢一
    • Organizer
      2023 年度 日本分類学会大会
    • Related Report
      2023 Research-status Report

URL: 

Published: 2023-04-13   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi