2020 Fiscal Year Annual Research Report
Project/Area Number |
16K00066
|
Research Institution | Nagasaki University |
Principal Investigator |
鈴木 郁美 長崎大学, 情報データ科学部, 准教授 (20637730)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 近傍法 / 高次元 |
Outline of Annual Research Achievements |
ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である. 本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す. 本研究では,研究代表者のこれまでの研究をより深化させ,特にハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする. 高次元空間では,我々が低次元空間で理解することがそのまま通じる訳ではなく,「次元の呪い」として知られる,一見不思議な現象が起こる.例えば,空間の縁にデータが集中する現象は,次元の呪いの一つとして以前から知られていたが,最近,新たな次元の呪いとして,高次元データにはハブが出現するハブネスの現象が報告された. ハブの出現は,非常に多くの事例の近傍に出現するため,近傍情報を利用した高次元データの検索や分類に対し,望ましくない結果をもたらす. 実際,商品推薦システムでは,ハブとなる商品が推薦されてしまう(Knees et al. ICMR 2014),音楽検索をする際,常に同じ音楽(ハブ)がランキングの上位に現れる(Schnitzer et al. JMLR 2012),文書分類などの分類タスクにおいて,クラスラベルに関係なく多くの事例の近傍に頻出する問題(Radovanovic et al. JMLR 2010) など,多岐にわたるタスクにおいて,ハブの影響が報告されている. 本研究では,データの高次元性に由来するハブネスの影響を軽減方法の開発を行った. ハブネスの軽減を行うことにより,分類や検索の精度を向上することができた.
|