• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Research-status Report

汎用性獲得のための統計的ラフ集合手法によるルール導出法の改善と判別問題への適用

Research Project

Project/Area Number 20K11937
Research InstitutionShimane University

Principal Investigator

加藤 裕一  島根大学, 総合理工学部, 名誉教授 (10161126)

Project Period (FY) 2020-04-01 – 2023-03-31
KeywordsIf-then ルール / 決定表 / トランザクションデータベース / 共起集合 / 相関ルール法 / データ発生・ルール導出検証モデル
Outline of Annual Research Achievements

申請者の提案している,決定表(①)からの「統計的ラフ集合理論による(if-then)ルール導出法」STRIM(A)と近い手法として,相関ルール法(B)が既によく知られている。この手法は,トランザクションデータベース(②)中に潜むif-thenルール導出を行う。例えば,ネット上で書籍を購入すると,他の人はそれに関連する書籍を購入したことを知らせ,購入推奨する機能等に実用化されている。2020年度は,両者のルール導出法の共通性と差異及び相関ルール法の問題点を明瞭化した。具体的には,データ発生・ルール導出検証モデルを利用して,1)①は②の特殊な場合で,条件C・決定属性D(説明・目的変数)の区別のないデータベースであること。この為,2)説明変数と決定変数が混在するルールと呼べないルールを導出する。この根本的原因は,Bは変量CとDの区別をせず,両変量の共起集合に基づき両者の共起性の強い変量の組合せをif-thenルールとして整理するためである。即ち,共起集合は母集団に潜む確率モデルP(C,D)に基づき発生することを明瞭に指摘した。一方,Aはルール導出とは,データに潜む条件付き確率モデルP(D|C)=P(if C then D)を推定することを指摘している。この成果は,Y. Kato and T. Saeki: New Rule Induction Method by Use of a Co-occurrence Set from the decision Table, RuleML+RR 2020, LNCS 12173, pp.54-69, 2020. に発表した。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

従来のデータ発生・検証モデルでは,実データの発生を単純化したルール完全一致仮説(CCH)に基づいてデータを発生し,STRIMによるルール導出手法の正当性をシミュレーション実験で検証した。また,実データに適用してその有効性を検討した。一方,データベースに潜むルールを導出する様々な手法が従来提案されている。そのいくつかは,既に実用に供せられている。特にそれらの内,数量化2類,木構造法(CART法・ランダムホレスト法等),相関ルール法などとのルール導出法の基本的原理と性能比較を考察した。他方,実データとの対応性を考慮して,完全一致仮説を緩めた部分一致仮説(PCH)に基づいたデータ発生モデルも提案した。このデータにSTRIMを適用可能とする改善手法を様々考察しているが,一般性を獲得するまでには至っていない。具体的には,Y.Kato, T. Saeki and J. Fei: Application of STRIM to Datasets Generated by Partial Correspondence Hypothesis, TPNC2018, LNCS11324, pp.74-86, 2018.である。

Strategy for Future Research Activity

今後の研究方針として,
1) PCHによるデータ発生モデルによるデータからのルール導出法として,Bayes法を利用した,結果から原因を探るルール導出法へSTRIMを改善する。更に,実データは各条件属性に重要度があると思われる。このような,ウエイトのあるデータ発生モデルでのルール導出法を考察する。
2)従来のルール導出手法・判別手法として利用されている,Bayesian NetworkやDeep Learning などとの得失をPCHによるデータで検討する。

Causes of Carryover

2020年度当初からの新型コロナウイルスの蔓延の為,外国・国内での学会発表,研究会参加の旅費を使用できなかった。本年度はワクチンも国内外に行き渡り昨年度分も利用して活発に活動できることを希望しています。

  • Research Products

    (2 results)

All 2020

All Presentation (1 results) (of which Int'l Joint Research: 1 results) Book (1 results)

  • [Presentation] New Rule Induction Method by Use of a Co-occurrence Set from the decision Table2020

    • Author(s)
      Y.Kato
    • Organizer
      4th International Joint Conference, RuleML+RR 2020
    • Int'l Joint Research
  • [Book] Rules and Reasoning 4th International Joint Conference, RuleML+RR 20202020

    • Author(s)
      Y.Kato and T.Saeki
    • Total Pages
      185
    • Publisher
      Springer
    • ISBN
      978-3-030-57976-0

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi