研究課題/領域番号 |
20K11937
|
研究機関 | 島根大学 |
研究代表者 |
加藤 裕一 島根大学, 総合理工学部, 名誉教授 (10161126)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | If-then ルール / 決定表 / トランザクションデータベース / 共起集合 / 相関ルール法 / データ発生・ルール導出検証モデル |
研究実績の概要 |
申請者の提案している,決定表(①)からの「統計的ラフ集合理論による(if-then)ルール導出法」STRIM(A)と近い手法として,相関ルール法(B)が既によく知られている。この手法は,トランザクションデータベース(②)中に潜むif-thenルール導出を行う。例えば,ネット上で書籍を購入すると,他の人はそれに関連する書籍を購入したことを知らせ,購入推奨する機能等に実用化されている。2020年度は,両者のルール導出法の共通性と差異及び相関ルール法の問題点を明瞭化した。具体的には,データ発生・ルール導出検証モデルを利用して,1)①は②の特殊な場合で,条件C・決定属性D(説明・目的変数)の区別のないデータベースであること。この為,2)説明変数と決定変数が混在するルールと呼べないルールを導出する。この根本的原因は,Bは変量CとDの区別をせず,両変量の共起集合に基づき両者の共起性の強い変量の組合せをif-thenルールとして整理するためである。即ち,共起集合は母集団に潜む確率モデルP(C,D)に基づき発生することを明瞭に指摘した。一方,Aはルール導出とは,データに潜む条件付き確率モデルP(D|C)=P(if C then D)を推定することを指摘している。この成果は,Y. Kato and T. Saeki: New Rule Induction Method by Use of a Co-occurrence Set from the decision Table, RuleML+RR 2020, LNCS 12173, pp.54-69, 2020. に発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
従来のデータ発生・検証モデルでは,実データの発生を単純化したルール完全一致仮説(CCH)に基づいてデータを発生し,STRIMによるルール導出手法の正当性をシミュレーション実験で検証した。また,実データに適用してその有効性を検討した。一方,データベースに潜むルールを導出する様々な手法が従来提案されている。そのいくつかは,既に実用に供せられている。特にそれらの内,数量化2類,木構造法(CART法・ランダムホレスト法等),相関ルール法などとのルール導出法の基本的原理と性能比較を考察した。他方,実データとの対応性を考慮して,完全一致仮説を緩めた部分一致仮説(PCH)に基づいたデータ発生モデルも提案した。このデータにSTRIMを適用可能とする改善手法を様々考察しているが,一般性を獲得するまでには至っていない。具体的には,Y.Kato, T. Saeki and J. Fei: Application of STRIM to Datasets Generated by Partial Correspondence Hypothesis, TPNC2018, LNCS11324, pp.74-86, 2018.である。
|
今後の研究の推進方策 |
今後の研究方針として, 1) PCHによるデータ発生モデルによるデータからのルール導出法として,Bayes法を利用した,結果から原因を探るルール導出法へSTRIMを改善する。更に,実データは各条件属性に重要度があると思われる。このような,ウエイトのあるデータ発生モデルでのルール導出法を考察する。 2)従来のルール導出手法・判別手法として利用されている,Bayesian NetworkやDeep Learning などとの得失をPCHによるデータで検討する。
|
次年度使用額が生じた理由 |
2020年度当初からの新型コロナウイルスの蔓延の為,外国・国内での学会発表,研究会参加の旅費を使用できなかった。本年度はワクチンも国内外に行き渡り昨年度分も利用して活発に活動できることを希望しています。
|