2015 Fiscal Year Annual Research Report
大規模高次元データの近傍検索・分類に適した類似度尺度の研究
Project/Area Number |
25730142
|
Research Institution | Yamagata University |
Principal Investigator |
鈴木 郁美 山形大学, 理工学研究科, 助教 (20637730)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | ハブネス / カーネル法 / 協調フィルタリング / 空間中心性の消去 / ハブネスの軽減 |
Outline of Annual Research Achievements |
データが高次元であるとき「次元の呪い」と言われる不思議な現象が起こる.ごく最近新たな現象として,データ中心に近い事例が,次元が高くなると非常に多くの事例と距離が近くなる現象が報告された.この事例はハブと呼ばれ,ハブは他の事例のk近傍に頻出するため,近傍情報を利用した分類や検索,グラフ構築に悪影響を及ぼす. 研究代表者は,「セントロイドとの類似度を全データに対して一定にする」条件を満たすラプラシアンベースのカーネルが,ハブの出現を抑えることを発見した.また,類似度行列をセンタリングする,すなわち,特徴空間上でベクトルの原点をセントロイドに置き換えることによっても,上記条件が満たされることに着目し,ハブの出現が抑えられることを確認した.この一連の研究は,データ中心化により「空間中心性」を消去すること(Elimination of Spatial Centrality)で,ハブを減らせることを示している. このハブを減らすメカニズムを,機械学習やパターン認識の応用分野に適応をおこなった. その一例として,協調フィルタリングに基づく推薦システムは,平均的 なデータをシステムに恣意的に投じる攻撃(サクラ攻 撃)に対して脆弱であることが知られている.これに 対して本論文は,投入された偽ユーザが推薦アイテム の決定に大きな影響力を持たないようにする,つまり,,偽ユーザがハブユーザにならないようにするためには,そもそも,ハブとなるデータが発生しにくいような環境を作れば良い,というアイデアによって脆弱性を解消した.
|
-
-
[Presentation] Reducing Hubness for Kernel Regression2015
Author(s)
Kazuo Hara, Ikumi Suzuki, Kei Kobayashi, Kenji Fukumizu and Milos Radovanovic
Organizer
In proceedings of the 8th International Conference on Similarity Search and Applications (SISAP)
Place of Presentation
University of Strathclyde(Glasgow, UK)
Year and Date
2015-10-12 – 2015-10-14
Int'l Joint Research
-
-