研究課題/領域番号 |
16K00066
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
統計科学
|
研究機関 | 長崎大学 (2019-2020) 山形大学 (2016-2018) |
研究代表者 |
鈴木 郁美 長崎大学, 情報データ科学部, 准教授 (20637730)
|
研究期間 (年度) |
2016-04-01 – 2021-03-31
|
研究課題ステータス |
完了 (2020年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2019年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2017年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2016年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 近傍法 / ハブネス / 半教師あり学習 / 高次元 / 空間中心性 / ハブの軽減 / Hubness / Semi-supervised learning / Spatial centrality / 大規模高次元データ / 機械学習 |
研究成果の概要 |
ビックデータが大きな注目を集める中,大量データから欲しい情報にたどり着くのは未だ難しい課題である. 本研究は,大規模高次元データ一面であるハブネス現象に着目し,欲しい情報にたどり着くための,より頑健な数理基盤の確立を目指す. 本研究では,研究代表者のこれまでの 研究をより深化させ,特にハブネスの発生原因である次元とデータの大規模性について数理的に解析を行い,関係を明らかにする.
|
研究成果の学術的意義や社会的意義 |
大規模高次元データは機械学習や統計科学的に重要な対象であり,低次元の場合とは異る様相を見せることが知られているが,その理解はまったく十分ではない.特に新しい概念であるハブの問題は,高次元空間でハブが出現し問題となる,という指摘に留まっており,特にその解決法は,申請者らの研究以外世界的にもあまり見当たらない.データが増えるにつれ,欲しい情報にたどり着くことは難しい.その要因の一つであるハブの存在が悪影響を与えていると考えられ,妥当な検索結果を得ることができないという障害が一因となっていると考えられる.一般的な大規模高次元データに対する分類・検索などの様々な応用につながるため,実用的な意義は大きい
|