研究課題/領域番号 |
21K17715
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 長崎大学 |
研究代表者 |
梅津 佑太 長崎大学, 情報データ科学部, 准教授 (60793049)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2024年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | スクリーニング / 一般化線形モデル / 正則化法 / 超高次元データ / カーネル法 / 加法モデル / 変数選択 / スパース正則化法 / post-selection inference |
研究開始時の研究の概要 |
変数の数が標本サイズよりも非常に大きな超高次元データの解析では、古典的な統計解析を行うことが困難である。データの構造に対してある種のスパース性を仮定し、あらかじめ解析に不要と思われる変数を取り除くことで超高次元データ特有の難しさを緩和することが期待できる。このような手法はスクリーニングと呼ばれるモデル選択の問題の一種である。ところが、非線形の依存関係を抽出しようとすると、既存手法では必要以上に多くの変数をスクリーニングしなければならない。本研究では、非線形の依存関係を効率的に抽出するためのスクリーニング手法の開発および、スクリーニングによって選択されたモデルに対する統計的推論手法を開発する。
|
研究実績の概要 |
変数の数が標本サイズよりも非常に大きな超高次元データ解析に関して, 目的変数と関連のある説明変数を効率的に選択するための変数選択について, 一般化線形モデルのもとで考察した. 具体的には, 一般化線形モデルにおける周辺尤度最大化基準にスパース性を誘導する正則化項を付加することで, シンプルながらも理論的に良い性質を持つ変数選択基準を提案した. 本研究で提案した手法はスクリーニングと呼ばれる変数選択の一種である. アルゴリズムそのものは線形回帰モデルで提案されたものとほぼ同じものであるが, 本研究ではその基準を, ロジスティック回帰モデルやポアソン回帰モデルのような, 一般化線形モデルに対しても同じように適用可能であることを示した. また, スクリーニングでは, 適当なしきい値を定め, 変数選択のスコアがそのしきい値よりも大きければ変数間に関連があると判断する. 本研究では, 上記のような手法の提案とともに, スコアの漸近分布に基づくしきい値の選択についても提案した. 一方, 昨年に引き続き, カーネル法に基づくスクリーニング手法についても現在論文化を目指している.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
今年度行った, 一般化線形モデルに対するスクリーニング手法に関する研究については, 学会誌にて受理済みである. この結果を元に, 変数間に非線形な関係があるような, より複雑なデータに対するスクリーニング手法についても同様の手順で新規性のある研究ができると考えている. 一方, 昨年度に引き続き, カーネル法を用いた非線形な関係性の検出に関する研究についても現在論文としてまとめている最中である.
|
今後の研究の推進方策 |
昨年度の成果がまだ論文として完成していないため, 早急に論文としてまとめたい. また, 今年度の結果を元に, 交互作用のある一般化線形モデルや, 一般化加法モデルのような, より複雑な現象を解析するためのモデルに対するスクリーニング手法の開発を目標とする.
|