• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

Hubness Analysis

Research Project

Project/Area Number 16K00066
Research InstitutionNagasaki University

Principal Investigator

鈴木 郁美  長崎大学, 情報データ科学部, 准教授 (20637730)

Project Period (FY) 2016-04-01 – 2021-03-31
Keywords近傍法 / 高次元
Outline of Annual Research Achievements

ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である. 本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す. 本研究では,研究代表者のこれまでの研究をより深化させ,特にハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする. 高次元空間では,我々が低次元空間で理解することがそのまま通じる訳ではなく,「次元の呪い」として知られる,一見不思議な現象が起こる.例えば,空間の縁にデータが集中する現象は,次元の呪いの一つとして以前から知られていたが,最近,新たな次元の呪いとして,高次元データにはハブが出現するハブネスの現象が報告された. ハブの出現は,非常に多くの事例の近傍に出現するため,近傍情報を利用した高次元データの検索や分類に対し,望ましくない結果をもたらす. 実際,商品推薦システムでは,ハブとなる商品が推薦されてしまう(Knees et al. ICMR 2014),音楽検索をする際,常に同じ音楽(ハブ)がランキングの上位に現れる(Schnitzer et al. JMLR 2012),文書分類などの分類タスクにおいて,クラスラベルに関係なく多くの事例の近傍に頻出する問題(Radovanovic et al. JMLR 2010) など,多岐にわたるタスクにおいて,ハブの影響が報告されている.
本研究では,データの高次元性に由来するハブネスの影響を軽減方法の開発を行った. ハブネスの軽減を行うことにより,分類や検索の精度を向上することができた.

  • Research Products

    (2 results)

All 2020

All Presentation (2 results) (of which Int'l Joint Research: 1 results)

  • [Presentation] Target Evaluation for Neural Language Model using Japanese Case Frame2020

    • Author(s)
      Kazuhito Tamura, Ikumi Suzuki, Kazuo Hara
    • Organizer
      The 12th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management
    • Int'l Joint Research
  • [Presentation] 日本語格フレームを用いた言語モデルの評価2020

    • Author(s)
      田村和仁,原一夫,鈴木郁美
    • Organizer
      第34回 人工知能学会全国大会

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi