研究課題/領域番号 |
21K11779
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 山形大学 |
研究代表者 |
原 一夫 山形大学, 理学部, 教授 (30467691)
|
研究分担者 |
鈴木 郁美 岩手県立大学, ソフトウェア情報学部, 准教授 (20637730)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 高次元データ / ハブネス / 変化検知 |
研究開始時の研究の概要 |
本研究は,これまで「次元の呪い」として厄介者扱いをされてきたハブネスを,逆に,「次元の恵み」として活用することによって,高次元単位球面上において高い検出力を持つ一様性検定の新たな手法を構築する.さらに,構築する手法を用いて,時系列データの変化検知や近似近傍検索といった,高次元データに関わるタスクを解決する.
|
研究実績の概要 |
高次元で発生する現象である「ハブネス」,すなわち,データ中心に近い少数のデータが特別なデータとなる現象は「次元の呪い」として知られている.最近,われわれは,高次元空間では,データ密度に濃淡があるとき(つまり,データ分布が一様でないとき),そして,そのときに限って,ハブネスが生じることを見い出した.他方,単位球面上における一様性検定の代表的手法である Gine's test には,高次元では検出力が落ちるという弱点がある.本研究は,これまで「次元の呪い」として厄介者扱いをされてきたハブネスを,逆に,「次元の恵み」として活用することによって,高次元単位球面上において高い検出力を持つ一様性検定の新たな手法を構築する.さらに,構築する手法を用いて,時系列データの変化検知や高次元データの2標本検定といった,高次元データに関わるタスクを解決する.
本年度の研究実績は,昨年度に開発した時系列データの変化検知手法をバージョンアップさせたことである.具体的には,knnステップ,残差ステップ,正規化ステップを一つのブロックとして,このブロックを複数回繰り返すと,変化検知の精度が高まることである.このバージョンアップによって,高次元データの2標本検定においても,精度を高めることを確認した.今年度は,バージョンアップした手法の論文投稿を行う.さらに,単位球面上における一様性検定手法に関する論文投稿も,できれば行う予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究で取り組む予定の3つのタスク:(i)高次元単位球面上におけるデータの一様性の検定,(ii)時系列データの変化検知,(iii)高次元データの2標本検定のすべてを順調に進めているところである.残されているのは,論文投稿である.
|
今後の研究の推進方策 |
(ii)時系列データの変化検知,(iii)高次元データの2標本検定の論文投稿が完了し次第,(i)高次元単位球面上におけるデータの一様性検定の論文投稿に進む.
|