2023 Fiscal Year Annual Research Report
Machine learning from incomplete information table by rule generation and its application
Project/Area Number |
20K11954
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
酒井 浩 九州工業大学, 大学院工学研究院, 教授 (60201513)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 表データ解析 / ルール生成 / 不完全情報 / NIS-アプリオリアルゴリズム / 欠損値補完 / データマイニング / ルール生成による機械学習 / ラフ集合と粒状計算 |
Outline of Annual Research Achievements |
研究代表者はPawlakのラフ集合とAgrawalのアプリオリ法を融合し,DIS-アプリオリ法 (通常の情報表(DISとよぶ)からルールを生成)とNIS-アプリオリ法(不完全な情報表(NISとよぶ)から確実ルールと可能性ルールを生成)を提案・実現している.今回,今までの研究を発展させ「NISからのルールを生成・活用しながら,逐次的に真の情報表DISと真のルールを推定する手法」を提案し,これをルール生成による機械学習Machine Learning by Rule Generation (MLRG)として研究を行った. MLRGでは対象の属性Aの欠損値を補完するために,Aを決定属性とする確実ルールを生成し,欠損値を含む対象にヒットする最も強い確実ルールの結論部で欠損値を補完する.元データにランダムに欠損値を作り交差検証の実験を通して,MLRGの補完精度を考察した.一様に都合よく補完できるとは限らず,補完の精度は属性間の従属性に影響されることを確認した.成果を「知能と情報」誌から出版した. さらに,属性間の従属関係を検討した.属性を固定すれば従属度を計算できるが,この場合,(2の属性数乗)の場合が生じる.研究代表者は同じ属性から成るルールのサポート値の和が従属度に一致する性質を利用し,この問題に対する一解決手法を示した.また,表データに限らずクラスター化されたデータ,時系列データ,ファジイのメンバシップ値データなど多様な異種データから一様にルールを生成する枠組Descriptor-based Information System (DbIS)の体系を提案しIUKM2023,Springer LNCS誌で発表した.整備した環境と実行例を示すための動画を下記にアップロードし公開している. https://www.mns.kyutech.ac.jp/~sakai/RNIA/
|