研究課題/領域番号 |
18K11426
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 東京大学 |
研究代表者 |
稲葉 真理 東京大学, 大学院情報理工学系研究科, 准教授 (60282711)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2020年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2019年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 最適化問題 / 幾何構造を利用する最適化 / グラフ構造を利用する最適化 / スカイライン問題 / SAT ソルバ / スカイライン / パレート最適 / サンプルの多様性 / クラスタリング問題 / 凸包 / ミニマ / 特徴抽出 / スカイライン計算 / 計算幾何 / データ抽出 / 境界集合 |
研究成果の概要 |
大規模データを用いた学習・予測・探索の性能を向上させるため、オリジナルデータからアプリケーショ ンの目的に合致したサンプルデータを抽出するための手法の提案を行った。具体的には、ランダムサンプリングでは困難な裾野データや、ある特徴量で最大値をとるといった「際立った特徴を持つデータ」を、サンプル集合の中に含めることを目標とし幾何的性質を利用しながらも、特徴空間においてデータ集合の凸包を求めると高次元での計算コストが非常に高いため、本研究では、スカイライン問題、および、高速にスカイライン問題を解くためのBJR-tree 構造を用いたデータサンプリングを提案し、低中次元における実装実験を行った。
|
研究成果の学術的意義や社会的意義 |
BJR-tree 構造を用いて、pseudo-skyline 問題を効率よく解くことで、サンプル抽出することにより、「際立った特徴を持つデータ」をこぼすことなく、サンプル集合を得ることができる。この手法を、TCP/IP輻輳制御問題および、アプリケーション実行時に利用されるアドレス検出の強化学習実験で検証した結果、低中次元の特徴空間においては、概ね、予想通りの結果を得ることができたたが、高次元化すると、psuedo-skyline 集合が爆発的に増大してしまうため、多様性を用いた大規模データの探索問題に問題範囲を広げ、幾何構造に重ねる形でグラフ構造(本研究ではラティス)を用いた提案も行った。
|