Project/Area Number |
21K11779
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Yamagata University |
Principal Investigator |
原 一夫 山形大学, 理学部, 教授 (30467691)
|
Co-Investigator(Kenkyū-buntansha) |
鈴木 郁美 岩手県立大学, ソフトウェア情報学部, 准教授 (20637730)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | 高次元データ / ハブネス / 変化検知 |
Outline of Research at the Start |
本研究は,これまで「次元の呪い」として厄介者扱いをされてきたハブネスを,逆に,「次元の恵み」として活用することによって,高次元単位球面上において高い検出力を持つ一様性検定の新たな手法を構築する.さらに,構築する手法を用いて,時系列データの変化検知や近似近傍検索といった,高次元データに関わるタスクを解決する.
|
Outline of Annual Research Achievements |
高次元で発生する現象である「ハブネス」,すなわち,データ中心に近い少数のデータが特別なデータとなる現象は「次元の呪い」として知られている.最近,われわれは,高次元空間では,データ密度に濃淡があるとき(つまり,データ分布が一様でないとき),そして,そのときに限って,ハブネスが生じることを見い出した.他方,単位球面上における一様性検定の代表的手法である Gine's test には,高次元では検出力が落ちるという弱点がある.本研究は,これまで「次元の呪い」として厄介者扱いをされてきたハブネスを,逆に,「次元の恵み」として活用することによって,高次元単位球面上において高い検出力を持つ一様性検定の新たな手法を構築する.さらに,構築する手法を用いて,時系列データの変化検知や高次元データの2標本検定といった,高次元データに関わるタスクを解決する.
本年度は,昨年度に引き続き,時系列データの変化検知手法の開発を進めた.特に,人工データ,および,実データを用いて,既存のパラメトリック手法との精度を比較する実験を行った.現在,論文投稿中である. また,本年度の研究実績は,自然言語処理分野における高次元ベクトルである単語ベクトルを調査したことである.動詞とその否定に対応する単語ベクトルを用いた演算の精度は,平均ベクトルを取り除くと向上することが明らかになった.この結果はハブネスが抑制されたことと関連があると考えられる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究で取り組む予定の3つのタスク:(i)高次元単位球面上におけるデータの一様性の検定,(ii)時系列データの変化検知,(iii)高次元データの2標本検定,を順調に進めているところである.残されているのは,論文投稿である.
|
Strategy for Future Research Activity |
(ii)時系列データの変化検知,(iii)高次元データの2標本検定の論文投稿が完了し次第,(i)高次元単位球面上におけるデータの一様性検定の論文投稿に進む.
|