2018 Fiscal Year Annual Research Report
Knowledge discovery method in large scale data using artificial missing values
Project/Area Number |
16K00316
|
Research Institution | Fukuoka Nursing College |
Principal Investigator |
嶋田 香 福岡看護大学, 看護学部, 教授 (20454100)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 知識発見 / 人工知能 / ソフトコンピューティング / データマイニング / 欠損値 |
Outline of Annual Research Achievements |
世代継続的に成果を蓄積して課題解決をしていく進化型計算手法を用いて欠損値を含むデータベースからIF~THEN~型ルール集合を発見する方法の応用として、データベースに人工的欠損値を導入することを特徴とする知識発見方法の研究開発を実施した。人工的欠損値は、ある方策によってデータベースの情報を間引いて隠すなどしたものである。2016年度には、ルールベースの予測・分類問題における数値属性の離散化において離散化時の境界値付近の値を欠損値として扱うことを特徴とする方式を比較的小規模の医療データ等を用いた評価した。2017年度には、ビッグデータにおいては情報の取捨選択などによるデータの有効活用が課題となることから、属性数の多い場合について拡張した方法の検討・評価を行った。また、与えられたデータベースに最適な人工的欠損値生成の設定法、属性間の欠損値発生条件の組合せ最適化などのアルゴリズムの検討を行った。属性数の増加に伴って人工的欠損値の導入による評価が複雑となることから、その評価法の検討についても行った。2018年度には、予測・分類の精度向上などに有効な人工的欠損値の導入条件を見出すことによるデータベースの属性間の関連性を含めたデータ構造に関する知識発見方法を含めた検討・評価を行ったほか、人工的欠損値の利用の配置の方策によっては、取得されたデータの個々の値に関しての信頼性評価への応用の可能性があること、データベースにおける特定の属性あるいは属性の組合せが、目的とする属性と因果関係にあるとした場合の評価指標の算定への応用の可能性があることについて検討した。また、実社会への応用の観点から、所属機関の研究者らと協力して比較的大規模なデータを用いた医療専門家の視点からの発見されたルール集合の解釈や分類結果等の検討・評価を行った。
|