研究領域 | データ記述科学の創出と諸分野への横断的展開 |
研究課題/領域番号 |
23H04483
|
研究種目 |
学術変革領域研究(A)
|
配分区分 | 補助金 |
審査区分 |
学術変革領域研究区分(Ⅱ)
|
研究機関 | 統計数理研究所 |
研究代表者 |
日野 英逸 統計数理研究所, 先端データサイエンス研究系, 教授 (10580079)
|
研究期間 (年度) |
2023-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2023年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | ロバスト推定 / 位相的データ解析 / 可視化 |
研究開始時の研究の概要 |
外れ値の混入に対してロバストな記述子抽出手法と,信頼のできない情報の混入に対してロバストな情報統合手法を開発し,それをデータ記述科学の推進において本質的な役割を果たす高次元データの「かたち」と「うごき」を捉える記述子抽出に組み込むことを目的として研究を行う.外れ値の概念は科学的新規性と表裏一体である.ロバストな特徴抽出手法及び情報統合の手法を応用して,特徴的なデータをスクリーニングによって見つけ出す効率的な手法を開発し,新規材料の発見やインフラ構造材料の劣化の検出への応用を目指す.
|
研究実績の概要 |
外れ値にロバストな分布の統合方法を,空間統計における地価予測に応用した.その手法を,空間統計における地価予測に応用した.空間的に変動する回帰モデルの係数(SVC)は,生態学,環境科学などの分野で説明変数と被説明変数の関係を調査するためにモデル化されている.地理的加重回帰(GWR)とガウス過程(GP)回帰はSVCをモデル化するためによく用いられる.GWRは局所的な回帰技術であり,小規模な地図パターンを正確に捉えることがでるが,変数の不安定さが問題となる.GP回帰は大規模な地図パターンを安定的にモデル化するが,基底関数の数が限られているために過度に滑らかな地図パターンになりがちである. GWRと低ランクGPモデルの混合を考慮してお互いの欠点を補完することが考えられるが,特にGWRの係数の不安定さを解消するため,ロバストな分布の混合方法を適用したところ,少数サンプルの場合も安定した挙動を示した. また,グラフ上の拡散過程を表すグラフラプラシアンを元にして,ロバストなパーシステントダイアグラムの構成を検討した.安定性定理や影響関数の導出などを行い,提案手法が確かにロバストで位相的データ解析に供することを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
外れ値の混入に対してロバストな記述子抽出手法と,信頼のできない情報の混入に対してロバストな情報統合手法を開発し,それをデータ記述科学の推進において本質的な役割を果たす高次元データの「かたち」と「うごき」を捉える記述子抽出に組み込むことが本研究の目的である.これまで申請者が開発したガンマ冪ダイバージェンスに基づくロバストな情報統合の,空間統計分野への応用に着手した.また,外れ値にロバストなパーシステントダイアグラムの構成方法に関する研究も開始しており,いずれもポジティブな結果を得られている.さらに,計画班の材料科学者らとの協業を開始し,正規化フローによる未観測データの補完を電池材料の特性の解析に応用する研究を開始した.また,他の公募班・計画班との協業にも着手しており,まだ具体的な成果は出ていないものの互いの強みを生かした研究を進めることが出来ている.
|
今後の研究の推進方策 |
2023年度に着手した,外れ値にロバストなパーシステントダイアグラムの構成方法の研究を進める.一定の理論的成果は得られたものの,既存手法との関連や,さらなるグラフ構造の活用,実データ解析の例など,明らかにすべき事項は多いので,一つ一つ検討していく.領域内で立ち上がったコラボレーションを進める.特に材料科学者との協業と,幾何学・力学系理論の研究者との協業はいずれも応用・理論においてユニークな研究が期待されるので,十分な議論を行って本年度中に方向性を定める.
|