研究課題
基盤研究(B)
本研究ではクラスラベルの付与された多次元の特徴空間を持つカテゴリカルデータからクラスラベルに関連する極小の特徴集合を抽出する特徴選択アルゴリズムに着目した。本研究の対象とするフィルター型の特徴選択アルゴリズムを構成する2つの要素、特徴集合とクラスラベル間の関連性を表す尺度(一貫性尺度)、および極小特徴集合の探索戦略について理論的および実験的な解析を行った。これらの解析に基づき、既存アルゴリズムを改良し、同種の既存手法の中では最速かつ規模耐性のある高精度なアルゴリズムを開発・実装した。また、開発した特徴選択アルゴリズムをTwitterからのトピック抽出と、グラフ構造からのパターン抽出に応用した。
情報科学