研究課題/領域番号 |
23K11005
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 滋賀大学 |
研究代表者 |
松井 秀俊 滋賀大学, データサイエンス学系, 教授 (90633305)
|
研究期間 (年度) |
2023-04-01 – 2028-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2027年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2026年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2025年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
|
キーワード | 統計的モデリング / 関数データ解析 / スパース推定 / 空間データ分析 |
研究開始時の研究の概要 |
1つの観測が経時的に繰り返し測定されたデータに対する統計的モデリング手法の開発をめざす。本研究では、空間上の様々な地点で観測された経時測定データを用いて、未観測地点での変動を予測するために、より解釈しやすく、効率的な方法について検討する。加えて、定義域が観測個体により異なる関数データに対して、定義域の違いによる関係性の違いを考慮に入れた変動ドメイン関数回帰モデルに対する効率的な推定方法についても検討する。
|
研究実績の概要 |
観測個体それぞれが時間等の経過に伴い繰り返して計測されたデータに対するモデリングと、情報集約のために用いられるスパース推定に基づくモデリングについての研究を進めた。関数データの終端時点が個体ごとに異なる場合、新たに計測された経時データが途中まで得られたときに、その先の軌道を予測するための方法について研究した。具体的には、関数データの定義域が個体ごとに異なる場合に用いられる分析方法である可変ドメイン関数データ解析と,将来の軌道を予測するために用いられる動的予測を組み合わせた方法を提案した。提案した手法および実データによる分析について、その成果を学会で発表し、現在論文として執筆中である。また、空間上で観測された経時データを関数データとして扱い、未観測地点を予測する方法の一つである関数クリギングを利用して、空間をクラスタリングする方法を論文として執筆し、国内論文誌に採択された。加えて、関数クリギングを高速に実行できるよう改良し、地震波の推定に応用した。提案した手法は共同研究者が学会で発表している。 メッシュ人口データに対して差分プライバシーを実現する方法にスパース推定を応用することで、既存手法よりも少ないノイズでプライバシー保護を行える方法を提案した。当該手法については共同研究者が研究集会で発表し、優秀研究賞を受賞した。また、回帰分析において、目的変数に寄与する説明変数を効率的に選択するスクリーニング手法において、多重共線性による精度悪化の影響を除去するための方法を改善する研究を進めた。当該研究についても学会で発表し、論文として投稿中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
終端時点の異なる関数データに対する軌道の動的予測では、予測のためのアルゴリズムを構築し,数値実験において提案手法が精度よく軌道を予測することができた。実際のデータに対しては軌道やその信頼区間の計算結果に課題が残ったものの、この点については次年度に引き続き原因の解明を進める予定である。また、関数クリギングに基づくクラスタリングに関する研究は年度内に論文として採択され、順調に成果を得ることができた。さらに、欠測値を含むデータに対する非線形モデルに対するスパース推定法についても論文を作成のうえ投稿し、現在改訂中である。以上のように、進めている研究について、いずれも順調に進展している。
|
今後の研究の推進方策 |
関数データに対する軌道の動的予測については、アルゴリズムの改善方法を検討し、実データに対する予測の性能を向上させる。提案した方法を論文としてまとめ、論文誌へ投稿予定である。加えて、欠測値を含む非線形モデルのスパース推定として、現在進めている研究とは異なるアプローチに基づく推定方法を進める予定である。 また、新たな方法として、説明変数に対応するデータの一つ一つが確率分布として表現され、目的変数が関数データとして与えられたとき、これらの関係を表現するモデルの構築方法および推定アルゴリズムを導出することを目指す。提案した方法を、製造業のデータの分析に応用する予定である。
|