研究課題/領域番号 |
19K12096
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 山梨大学 |
研究代表者 |
岩沼 宏治 山梨大学, 大学院総合研究部, 教授 (30176557)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | データマイング / 負の相関ルール / 圧縮 / 極小生成子 / アルゴリズム / 一般化 / 飽和集合 / 潜在因子 / 強飽和集合 / 一般化アイテム集合 / オンラインアルゴリズム / データマイニング / 列挙 / オンライン抽出 / 潜在的規則 |
研究開始時の研究の概要 |
大規模データ上で観測される事象の関係を考察するには,データの中に隠れている潜在因子を考慮することが極めて重要である.しかし潜在因子は直接には観測できないために,それに関係する法則の発見は非常に難しい.この問題に対処するために,我々は潜在的法則の表現としての負の相関ルールに着目し,その抽出法について研究を行う.負の相関ルールとは,¬X⇒Yや X⇒¬Y のような形の規則のことであり,¬X や ¬Y は潜在因子(負の事象集合)を表現している.¬X⇒Y は「Xが起きないときに Yがよく起きる」ことを意味する.負の相関ルールは正ルールでは表現できない潜在的な共起関係を表現でき,極めて有用でものである.
|
研究成果の概要 |
本研究では巨大データに潜在するルール型知識の抽出を目的として,負の相関ルールの効率的な抽出法について研究を行った.多数のルールの圧縮は,本質的にルールの一般化・抽象化を行うために極めて重要である.そのため負ルール集合の幾つかの圧縮原理,圧縮した形で負ルール集合を高速抽出するための原理とそれらの高速実行アルゴリズムを開発した.例えば,極小生成子の理論的な性質の解明と,その高速抽出アルゴリズムを開発している.また強飽和集合の高速オンライン抽出アルゴリズムなども開発している.更に,極小生成子の下方閉包性を利用した列挙木の上で,負ルールを圧縮した形で直接列挙するアルゴリズムを開発している.
|
研究成果の学術的意義や社会的意義 |
現実の世界を考えるとき,潜在因子も考慮した法則の発見抽出は重要な課題である.しかし,これまでのデータマイニングの研究では殆ど考慮されてこなかった.潜在的ルールの発見抽出は,統計的学習での潜在パラメータの推定問題等とは異なる問題であり,重要である.本研究の成果である負ルール集合の圧縮原理と直接抽出アルゴリズムにより,抽出計算が大幅に効率化・高速化でき,実用レベルの潜在関係規則のマイニングへ近づくことができた.ルール集合の圧縮は内在する共通な現象を発見して一つにまとめる作業と考えられる.これはルールを一般化することに相当し有用である.この圧縮に基づくマイニングはこれまで殆ど研究されていなかった.
|