2016 Fiscal Year Research-status Report
Project/Area Number |
16K00066
|
Research Institution | Yamagata University |
Principal Investigator |
鈴木 郁美 山形大学, 大学院理工学研究科, 助教 (20637730)
|
Project Period (FY) |
2016-04-01 – 2020-03-31
|
Keywords | ハブネス / ハブの軽減 / 半教師あり学習 / 大規模高次元データ |
Outline of Annual Research Achievements |
ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である.本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す.本研究では,研究代表者のこれまでの研究をより深化させ,特に,ハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする. 高次元空間では,我々が低次元空間で理解することがそのまま通じる訳ではなく,「次元の呪い」として知られる現象が起こる.例えば,空間の縁にデータが集中する現象は,次元の呪いの一つとして以前から知られていたが,最近,新たな次元の呪いとして,高次元データにはハブが出現するハブネスの現象が報告された(Radovanović et al. JMLR 2010). これまでの研究で,類似度尺度を変換することにより,ハブを軽減する方法を提案してきた.すなわち,ハブは高次元かつデータ中心との類似度が高い事例がハブになる,という事実に基づき,「データ中心との類似度をすべての事例に関して等しくする」ことによりハブを軽減する方法を提案した.データセット中にハブ事例が少なくなったことで,文書分類や検索,商品推薦システムの精度向上に繋がった. 本研究では,グラフィカルモデルや教師あり学習に枠組みにハブネスを組み込むことで,これまでハブネスとの関係が認識されなかった手法にも,距離や類似度尺度を設計することで取り組んだ.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
高次元空間ハブネスが出現するという報告にもとづき,我々はハブを軽減するための距離(AAAI 2015: Flattening the Density Gradient for Eliminating Spatial Centrality to Reduce Hubness),類似度尺度(AAAI 201EMNLP 2013の提案を行った.これらの成果にもとづき,高次元空間において減らしたハブの半教師あり学習の分類精度に対する影響を調べ,効果があることを確かめた.
|
Strategy for Future Research Activity |
半教師あり学習における学習方法には幾つかのアプローチがあるが,ハブの軽減についての効果を網羅的に調査することが今後の課題である.
|
Causes of Carryover |
国際会議の投稿が遅くなり,次年度で発表予定となったため.
|
Expenditure Plan for Carryover Budget |
国際会議の旅費など.
|