• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

「ハブネス」を活用して行う高次元データの解析

Research Project

Project/Area Number 21K11779
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 60030:Statistical science-related
Research InstitutionYamagata University

Principal Investigator

原 一夫  山形大学, 理学部, 教授 (30467691)

Co-Investigator(Kenkyū-buntansha) 鈴木 郁美  岩手県立大学, ソフトウェア情報学部, 准教授 (20637730)
Project Period (FY) 2021-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,030,000 (Direct Cost: ¥3,100,000、Indirect Cost: ¥930,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords高次元データ / ハブネス / 変化検知
Outline of Research at the Start

本研究は,これまで「次元の呪い」として厄介者扱いをされてきたハブネスを,逆に,「次元の恵み」として活用することによって,高次元単位球面上において高い検出力を持つ一様性検定の新たな手法を構築する.さらに,構築する手法を用いて,時系列データの変化検知や近似近傍検索といった,高次元データに関わるタスクを解決する.

Outline of Annual Research Achievements

高次元で発生する現象である「ハブネス」,すなわち,データ中心に近い少数のデータが特別なデータとなる現象は「次元の呪い」として知られている.最近,われわれは,高次元空間では,データ密度に濃淡があるとき(つまり,データ分布が一様でないとき),そして,そのときに限って,ハブネスが生じることを見い出した.他方,単位球面上における一様性検定の代表的手法である Gine's test には,高次元では検出力が落ちるという弱点がある.本研究は,これまで「次元の呪い」として厄介者扱いをされてきたハブネスを,逆に,「次元の恵み」として活用することによって,高次元単位球面上において高い検出力を持つ一様性検定の新たな手法を構築する.さらに,構築する手法を用いて,時系列データの変化検知や高次元データの2標本検定といった,高次元データに関わるタスクを解決する.

本年度は,昨年度に引き続き,時系列データの変化検知手法の開発を進めた.特に,人工データ,および,実データを用いて,既存のパラメトリック手法との精度を比較する実験を行った.現在,論文投稿中である.
また,本年度の研究実績は,自然言語処理分野における高次元ベクトルである単語ベクトルを調査したことである.動詞とその否定に対応する単語ベクトルを用いた演算の精度は,平均ベクトルを取り除くと向上することが明らかになった.この結果はハブネスが抑制されたことと関連があると考えられる.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究で取り組む予定の3つのタスク:(i)高次元単位球面上におけるデータの一様性の検定,(ii)時系列データの変化検知,(iii)高次元データの2標本検定,を順調に進めているところである.残されているのは,論文投稿である.

Strategy for Future Research Activity

(ii)時系列データの変化検知,(iii)高次元データの2標本検定の論文投稿が完了し次第,(i)高次元単位球面上におけるデータの一様性検定の論文投稿に進む.

Report

(3 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • 2021 Research-status Report
  • Research Products

    (2 results)

All 2024 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] Investigating Word Vectors for the Negation of Verbs2024

    • Author(s)
      Tomoya Sasaki, Yuto Kikuchi, Kazuo Hara, Ikumi Suzuki
    • Journal Title

      SN Computer Science

      Volume: 5 Issue: 2 Pages: 222-222

    • DOI

      10.1007/s42979-023-02554-x

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Patent(Industrial Property Rights)] 変化検出装置及び変化検出方法2023

    • Inventor(s)
      原一夫,鈴木郁美,村上英治
    • Industrial Property Rights Holder
      原一夫,鈴木郁美,村上英治
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      2023-046097
    • Filing Date
      2023
    • Related Report
      2022 Research-status Report

URL: 

Published: 2021-04-28   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi