• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実績報告書

ハブネスの数理基盤

研究課題

研究課題/領域番号 16K00066
研究機関長崎大学

研究代表者

鈴木 郁美  長崎大学, 情報データ科学部, 准教授 (20637730)

研究期間 (年度) 2016-04-01 – 2021-03-31
キーワード近傍法 / 高次元
研究実績の概要

ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である. 本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す. 本研究では,研究代表者のこれまでの研究をより深化させ,特にハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする. 高次元空間では,我々が低次元空間で理解することがそのまま通じる訳ではなく,「次元の呪い」として知られる,一見不思議な現象が起こる.例えば,空間の縁にデータが集中する現象は,次元の呪いの一つとして以前から知られていたが,最近,新たな次元の呪いとして,高次元データにはハブが出現するハブネスの現象が報告された. ハブの出現は,非常に多くの事例の近傍に出現するため,近傍情報を利用した高次元データの検索や分類に対し,望ましくない結果をもたらす. 実際,商品推薦システムでは,ハブとなる商品が推薦されてしまう(Knees et al. ICMR 2014),音楽検索をする際,常に同じ音楽(ハブ)がランキングの上位に現れる(Schnitzer et al. JMLR 2012),文書分類などの分類タスクにおいて,クラスラベルに関係なく多くの事例の近傍に頻出する問題(Radovanovic et al. JMLR 2010) など,多岐にわたるタスクにおいて,ハブの影響が報告されている.
本研究では,データの高次元性に由来するハブネスの影響を軽減方法の開発を行った. ハブネスの軽減を行うことにより,分類や検索の精度を向上することができた.

  • 研究成果

    (2件)

すべて 2020

すべて 学会発表 (2件) (うち国際学会 1件)

  • [学会発表] Target Evaluation for Neural Language Model using Japanese Case Frame2020

    • 著者名/発表者名
      Kazuhito Tamura, Ikumi Suzuki, Kazuo Hara
    • 学会等名
      The 12th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management
    • 国際学会
  • [学会発表] 日本語格フレームを用いた言語モデルの評価2020

    • 著者名/発表者名
      田村和仁,原一夫,鈴木郁美
    • 学会等名
      第34回 人工知能学会全国大会

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi