研究課題/領域番号 |
16K00066
|
研究機関 | 山形大学 |
研究代表者 |
鈴木 郁美 山形大学, 大学院理工学研究科, 助教 (20637730)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
キーワード | Hubness / Semi-supervised learning / Spatial centrality |
研究実績の概要 |
ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である.本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す.本研究では,研究代表者のこれまでの研究をより深化させ,特に,ハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする. 高次元空間では,我々が低次元空間で理解することがそのまま通じる訳ではなく,「次元の呪い」として知られる現象が起こる.例えば,空間の縁にデータが集中する現象は,次元の呪いの一つとして以前から知られていたが,最近,新たな次元の呪いとして,高次元データにはハブが出現するハブネスの現象が報告された(Radovanovi et al. JMLR 2010). これまでの我々の研究として,ハブネスのメカニズムの解明を,データ密度の観点から調べ,ハブの軽減の方法に取り入れてきた.多方面の理論的検証を行うことで,データ中心化によるハブの軽減の理論的根拠を強化した. 本年度は,我々が検証を行ってきたハブの影響とその軽減による半教師あり学習における効果を確かめた. 高次元由来のハブを含む特徴ベクトルをもとに,近傍グラフを構築すると,特定のノードが多くのノードとつながる.そのため,そのグラフをもとに学習を行うと,クラス判別がうまくいかない. そこで,我々が提案する高次元由来のハブを,データ中心化により取り除くことで,グラフベースの半教師あり学習の精度向上することができた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ハブの存在やその軽減が与える機械学習の半教師あり学習の枠組みにおいて,その効果について確認し,外部発表を行えたため.
|
今後の研究の推進方策 |
平成30年度は,半教師あり学習のハブの軽減の国際会議において発表したプロシーディングを,より詳細に調べジャーナル発表する.また,交付申請書に記載した課題「データ密度を考慮した距離の変換」について研究を進める予定である.
|
次年度使用額が生じた理由 |
当初購入したサーバーで,データ数を増やし大規模に実験を行う予定であったが,小さいサイズでの実験に時間をかけ,計算にかけるハードウェアの増設などを行わなかったため.次年度では,解析を行う計算機の増設に使用する予定である.
|