研究課題/領域番号 |
12680393
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 大阪府立大学 |
研究代表者 |
馬野 元秀 大阪府立大学, 総合科学部, 教授 (10131616)
|
研究分担者 |
林 勲 阪南大学, 経営情報学部, 教授 (70258078)
岡田 真 大阪府立大学, 総合科学部, 助手 (40336813)
宇野 裕之 大阪府立大学, 総合科学部, 講師 (60244670)
|
研究期間 (年度) |
2000 – 2002
|
研究課題ステータス |
完了 (2002年度)
|
配分額 *注記 |
1,900千円 (直接経費: 1,900千円)
2002年度: 800千円 (直接経費: 800千円)
2001年度: 1,100千円 (直接経費: 1,100千円)
|
キーワード | 説明知識の獲得 / ファジィルール獲得 / 数値属性と記号属性 / ファジィ決定木 / データ・マイニング / ファジィ理論 / 知識獲得 / ファジィ知識獲得 |
研究概要 |
現実のデータを考えると、機械・装置のログデータ、商店の販売データ、各種のアンケート調査のデータなどでは、数値属性と記号属性の両方を持つのが普通であり、さらにかなりの量の雑音や誤差や矛盾などが含まれている。しかし、データから知識を獲得する従来のほとんどの方法では、記号データか数値データのみにしか適用できない上に、雑音や誤差や矛盾などが含まれている場合にはうまく処理できないものが多かった。 本研究では、記号属性と数値属性の両方を含むデータから、できるだけ簡潔な説明型のファジィルールを抽出する方法をファジィID3を基にして定式化し、いくつかのデータ集合に対してシミュレーションを行なった。このときに、決定木の節点の数や説明できるデータの割合い(カバー率)などを評価に入れて定式化を行なった。そして、その成果を基にして、簡潔で分かりやすいファジィル知識を獲得するシステムの開発を行なった。 本システムにより得られるルールの形は Most data of {sex=male}{age=young} are {class=A} with coverage 0.91 Almost all data of {sex=female}{height=middle} are {class=B} with coverage 0.73 のようである。ここでは、属性sexとclassが記号属性で、ageとheightが数値属性である。このように、ファジィ集合を用いることにより数値属性を記号属性と同じレベルで処理できるようにしている。また、説明できるデータの割合いもファジィ集合mostで評価し、分かりやすくしている。
|