Project/Area Number |
23K18788
|
Research Category |
Grant-in-Aid for Research Activity Start-up
|
Allocation Type | Multi-year Fund |
Review Section |
0107:Economics, business administration, and related fields
|
Research Institution | Keio University |
Principal Investigator |
鳥谷部 智規 慶應義塾大学, 経済学部(三田), 助教 (50981370)
|
Project Period (FY) |
2023-08-31 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
|
Keywords | 半教師付き学習 / 生存時間分析 |
Outline of Research at the Start |
本研究では、ラベルありデータとラベルなしデータからの学習である半教師付き学習を生存時間分析モデルに拡張する。医療・マーケティング分野で扱うデータでは転院や他店舗での購入などの影響でイベント発生有無が正しく観測されているとは限らず、従来間違って負例と判断していたデータをラベルなしとみなすことで実態に沿った分析結果が得られることが期待される。本研究ではこの拡張の理論的な確立と実データを用いた分析を取り扱う。
|
Outline of Annual Research Achievements |
本研究の目的は、半教師付き学習、すなわちラベル付きデータとラベルなしデータを用いた学習を生存時間分析モデルへと拡張することである。通常の教師付き学習では、データは正例(Positive, P)と負例(Negative, N)として明確に分類される。しかし、半教師付き学習の一形態であるPositive-Unlabeled(以下、PU)学習では、正例とラベルなし(Unlabeled, U)データのみが得られ、負例に関する情報は与えられない。本研究では、このPU学習のアプローチを生存時間分析に適用し、イベントの発生が確認された正例データとイベントの発生が不明なラベルなしデータを用いて分析を行う新たな枠組みを提案する。 PU構造を持つ生存時間データの例として、医療分野では転院を伴う追跡、マーケティング分野では他店舗間での購入履歴などが挙げられる。これらはイベントの発生有無が正しく観測されているとは限らず、本来はラベルなしとして扱うべきデータを誤って負例と記録している可能性がある。本研究ではこのようなPU構造を持つ生存時間データに対して、従来のPU学習の仮定および従来の生存時間分析を拡張しモデル化を試みる。 2023年度の国際学会では、人工データを用いた推定結果を報告した。ここでは、PU構造を持つデータを使用した場合にPU構造の仮定下では推定結果が正確である一方で、PU構造を考慮しない従来手法では結果が大きく外れることを確認した。これはデータがPU構造を持つ場合に適切な仮定を用いて推定することの重要性を示している。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
上述のように人工データを用いた推定には成功しているものの、推定結果に対する妥当性を与える数学理論の導出の一部が当初想定していた形よりも困難であることが判明し、遅れが生じている。
|
Strategy for Future Research Activity |
2023年度の学会報告の内容から、数値実験が成功し、モデルの基本構造が完成していることを踏まえ、論文化の可能性についての検討を進めている。2024年度では推定に関する理論の導出を引き続き行い、その成果を論文にまとめ、学術雑誌への投稿を目指す。
|