研究概要 |
例外的ルールは,常識的な知識を表す通常的ルールに対する例外を表すものであり,他のルールに比較して知られていない可能性が高いために,きわめて有用となる場合がある.本研究では,主に次の3点について検討し,大規模データベースから領域固有のモデルや知識を用いずに例外的ルールを発見する手法を考案した. 1.例外的ルールの知識表現形式 例外的ルールと対応する通常的ルールを確率的に成立するプロダクションルールで表現し,それらの組ルールペアを発見対象の知識表現形式とした.この知識表現形式は,領域知識に依存せず,発見過程が効率的でありなおかつ発見対象としても汎用的で興味深いという利点がある。 2.情報理論的評価規準 まず,確率的プロダクションルールの潜在的有用性を,ITRULEシステムを開発したSmythらに習い,その圧縮情報量で評価することにした.次に,発見対象となるルールペアの評価規準として,通常的ルールの圧縮情報量と例外的ルールの圧縮情報量の積で定義される圧縮情報量積規準を提案した.この規準は,それぞれのルールの良さを適切に考慮し,各ルールの一般性,安定性,意外性を,領域情報に依存せず統一的かつ定量的に評価するものである. 3.効率的アルゴリズム 圧縮情報量積規準についての理論的な解析の結果,計算結果を変えずに,条件によっては20倍以上の高速化を可能にする新しい分枝限定法を考案した. 以上の手法に基づき,計算機上にプロトタイプシステムを構築し,さまざまなデータベースに適用することによってその有効性を実験的に確認した.
|