• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実施状況報告書

ハブネスの数理基盤

研究課題

研究課題/領域番号 16K00066
研究機関山形大学

研究代表者

鈴木 郁美  山形大学, 大学院理工学研究科, 助教 (20637730)

研究期間 (年度) 2016-04-01 – 2020-03-31
キーワードハブネス / ハブの軽減 / 半教師あり学習 / 大規模高次元データ
研究実績の概要

ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である.本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す.本研究では,研究代表者のこれまでの研究をより深化させ,特に,ハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする.
高次元空間では,我々が低次元空間で理解することがそのまま通じる訳ではなく,「次元の呪い」として知られる現象が起こる.例えば,空間の縁にデータが集中する現象は,次元の呪いの一つとして以前から知られていたが,最近,新たな次元の呪いとして,高次元データにはハブが出現するハブネスの現象が報告された(Radovanović et al. JMLR 2010).
これまでの研究で,類似度尺度を変換することにより,ハブを軽減する方法を提案してきた.すなわち,ハブは高次元かつデータ中心との類似度が高い事例がハブになる,という事実に基づき,「データ中心との類似度をすべての事例に関して等しくする」ことによりハブを軽減する方法を提案した.データセット中にハブ事例が少なくなったことで,文書分類や検索,商品推薦システムの精度向上に繋がった.
本研究では,グラフィカルモデルや教師あり学習に枠組みにハブネスを組み込むことで,これまでハブネスとの関係が認識されなかった手法にも,距離や類似度尺度を設計することで取り組んだ.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

高次元空間ハブネスが出現するという報告にもとづき,我々はハブを軽減するための距離(AAAI 2015: Flattening the Density Gradient for Eliminating Spatial Centrality to Reduce Hubness),類似度尺度(AAAI 201EMNLP 2013の提案を行った.これらの成果にもとづき,高次元空間において減らしたハブの半教師あり学習の分類精度に対する影響を調べ,効果があることを確かめた.

今後の研究の推進方策

半教師あり学習における学習方法には幾つかのアプローチがあるが,ハブの軽減についての効果を網羅的に調査することが今後の課題である.

次年度使用額が生じた理由

国際会議の投稿が遅くなり,次年度で発表予定となったため.

次年度使用額の使用計画

国際会議の旅費など.

URL: 

公開日: 2018-01-16  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi