2017 Fiscal Year Annual Research Report
A study of the problems associated with Rough Set Non-deterministic Information Analysis
Project/Area Number |
26330277
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
酒井 浩 九州工業大学, 大学院工学研究院, 教授 (60201513)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 不完全情報 / 非決定情報 / 可能世界意味論 / データマイニング / NIS-アプリオリ / ラフ集合 / 欠損値推定 |
Outline of Annual Research Achievements |
表データの不完全性も扱うデータ解析法とその応用を進めた。非決定情報(例えば、A,B,Cのいずれかが真の値)を含む表データに可能世界意味論を適用し、様相性(確実性、可能性)も処理するNIS-アプリオリアルゴリズムを提案・構築し、関連する諸問題の解決を図った。最終年度と研究期間全体を通して実施した4課題の成果を以下に列挙する。 (課題1)マイニングの基礎、少数派意見マイニング:ルールの集合に対して、NIS-アプリオリは健全であり完全であることを証明した。また、少数派意見をマイニングするためにターゲット付きNIS-アプリオリを提案し、実験を通してその有効性を示した。本成果をラフ集合の国際会議IJCRS2018に投稿中である。 (課題2)解析ソフトウェアの改善、ビッグデータへの対応:NIS-アプリオリアルゴリズムをSQL言語により実現し、より大きいサイズのデータまで扱えるように実行環境を改善した。実行例をhttp://www.mns.kyutech.ac.jp/~sakai/RNIAにUpしている。 (課題3)情報の希薄化とプライバシー・データ保護:データマイニングの結果から個人が特定されることを防ぐために、k-匿名性の概念が提案されている。研究代表者は非決定情報とNIS-アプリオリアルゴリズムによりk-匿名性に類似する機能の実現可能性を示している(IEEE BigData2016)。 (課題4)不完全な情報における機械学習と欠損値推定:欠損値を含む表データにおいて確実ルールを生成し、できるだけ多くの確実ルールが生じるように欠損値を推定する手法を提案し、SQLにより処理系を実現した。これは、統計学における最尤推定法(サンプルデータの発生確率が最も高くなるようにパラメータ値を推定する)に相当する欠損値推定法になると考える。本成果を現在、某ジャーナルに投稿中である。
|