2017 Fiscal Year Annual Research Report
The theory of filter based feature selection and high-performance algorithms
Project/Area Number |
26280090
|
Research Institution | Gakushuin University |
Principal Investigator |
久保山 哲二 学習院大学, 計算機センター, 教授 (80302660)
|
Co-Investigator(Kenkyū-buntansha) |
申 吉浩 兵庫県立大学, 応用情報科学研究科, 教授 (60523587)
チャクラボルティ バサビ 岩手県立大学, ソフトウェア情報学部, 教授 (90305293)
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 特徴選択 / カテゴリカルデータ / 変数間相互作用 / 変数選択 |
Outline of Annual Research Achievements |
当初、3年の研究計画であったが、海外での研究集会で予定していた本研究費からの旅費支出が不要になったため、1年期間を延長して、前年度までに得られたフィルタ型の特徴選択アルゴリズムCWCおよびその高速化アルゴリズムsCWCの実装に関する研究成果の普及・領域拡大のための期間とした。最終年度の研究成果は以下の通りである。 (1) 昨年度 github に公開した sCWC の scalaで実装をより洗練させた。たとえば、CWCでは入力データが一貫性、特徴集合によって一意にクラスラベルを特定できる「一貫性」を持たない場合には、一貫性をもつように入力データを加工する。従来実装では、特徴集合を新たに加えることによって、一貫性を持つようにデータを拡張していたが、より見通しがよくなるように、一貫性の妨げとなるインスタンスを削除する方法を採用した。また、CWCはカテゴリカルデータを対象としているが、ダミー変数を用いることにより、順序変数を扱うことができるため、そのための指針をドキュメントに追加した。 (2) sCWCおよび、sCWC の一貫性制約を緩和させた sLCC の成果を総括する内容を論文にまとめた。具体的には、開発した特徴選択アルゴリズムの理論計算量、および様々な実データによる検証、過去の特徴選択アルゴリズムとの比較、トピック抽出への応用などについてまとめた内容となっている。 (3) 本研究課題で開発した特徴選択アルゴリズムの適用領域の拡大をめざし、以下の2つの研究を行なった。(2-1) 遺伝的プログラミンッグによる化学化合物からのパターン抽出法において、次世代に残すべきパターンの適切な抽出のために、sCWC を用い、従来手法の性能を改善した。 (2-2) CWC の今後のさらなる改善のため、sCWCにより抽出される特徴集合が、極小一貫性特徴集合の中でどのような性質を持つのかを調査した。
|
Research Progress Status |
29年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
29年度が最終年度であるため、記入しない。
|
Research Products
(14 results)