• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

不均衡データに対する解析法の統合的理解と生存時間解析への発展的応用

研究課題

研究課題/領域番号 23K11013
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60030:統計科学関連
研究機関慶應義塾大学

研究代表者

林 賢一  慶應義塾大学, 理工学部(矢上), 准教授 (70617274)

研究期間 (年度) 2023-04-01 – 2027-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2026年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
キーワードロバスト推定 / べき密度ダイバージェンス / 二値回帰モデル / MCC / マシューズ相関係数 / 不均衡データ / 医学統計学 / 生物統計 / 機械学習 / 統計科学
研究開始時の研究の概要

本研究の目的は,不均衡データの諸解析法の統合的理解と,その生存時間解析への発展的応用である.不均衡データにおける主な問題は,比率の小さいクラスの情報がモデルの推測・評価に寄与しにくいことと,推定された統計モデルが不安定になりやすいことである.本研究では,これらの問題を克服するために提案されている方法を,統一的な視点から理解できるようにすることを目指す.通常,不均衡データは応答変数が二値(または多値)の回帰モデルに対するデータのことであるが,本研究ではこれらに対する方法を生存時間を応答変数とする回帰モデルに対して適用することも目指す.

研究実績の概要

本研究の目的は,不均衡データに対する諸解析法を統合的に理解するための枠組みを構築することと,その知見を生存時間解析へ発展的に応用することである.初年度である2023年度は,ロバストなダイバージェンスと判別超平面の推定に関する研究を実施した.その結果,ある特殊な場合のべき密度ダイバージェンスについて,Brierスコアとの関連とが見いだされ,さらにクラスの分離に関する重要な性質をもつことがわかった.これは最尤法(カルバック・ライブラーダイバージェンスによる推定)にはない性質である.この結果について現在論文を執筆中である.
また,MCC(マシューズ相関係数)に関する統計的推測の研究も実施した.MCCは二値の反応に対する診断の精度に関する指標であり,不均衡データの場合に有用であることが期待される.このMCCの漸近分布を,単純なデルタ法による近似とFisherのz変換を利用した近似という二つのアプローチによって導出し,これらを数値的に比較した.また,対応のあるMCCの差についても同様の解析を行った.この場合は前述の状況とは異なり,Fisherのz変換のような適当な全単射が存在しない.そのため,Zou (2007)などのアプローチを援用し,漸近分布を導出した.この研究については論文を執筆し,学術雑誌へ投稿した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

ロバストなダイバージェンスと二値回帰モデルにおけるBrierスコアの関係を見出したことと,これの特殊な性質を明らかにしたことは十分な進展であるといえる.MCCに関する研究も並行して実施できたことも考慮すると,進捗はおおむね順調であるといえる.

今後の研究の推進方策

ロバストなダイバージェンスとその他の損失関数に関する関連をより深く追及する.とくに,サンプリングに基づく方法との関連が興味深いと考えられる.

報告書

(1件)
  • 2023 実施状況報告書
  • 研究成果

    (4件)

すべて 2023

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (2件) (うち国際学会 1件)

  • [雑誌論文] <i>k</i> 近傍法を用いたリチウムイオン電池の微小内部短絡検出2023

    • 著者名/発表者名
      志村 重輔、林 沙織、岡安 悟志、板垣 昌幸、林 賢一
    • 雑誌名

      データ分析の理論と応用

      巻: 12 号: 1 ページ: 1-15

    • DOI

      10.32146/bdajcs.12.1

    • ISSN
      2186-4195, 2434-3382
    • 年月日
      2023-09-01
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Model Selection with Missing Data Embedded in Missing-at-Random Data2023

    • 著者名/発表者名
      Takai Keiji、Hayashi Kenichi
    • 雑誌名

      Stats

      巻: 6 号: 2 ページ: 495-505

    • DOI

      10.3390/stats6020031

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] Asymptotic properties of the Matthews correlation coefficient2023

    • 著者名/発表者名
      Yuki Itaya, Jun Tamura, Kenichi Hayashi, Kouji Yamamoto
    • 学会等名
      The 8th Japanese-German Symposium on Classification
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 生存-経時同時モデルに対する異質な部分集団への再帰分割法2023

    • 著者名/発表者名
      名取京太朗,林賢一
    • 学会等名
      2023 年度 日本分類学会大会
    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2023-04-13   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi