研究概要 |
本研究では、透明性を保ちながら、この二値化誤差からくる限界を克服するデータマイニングシステムの設計とその理論的解析を行う。このようなデータマイニングシステムは要望されてはいるが、現実化は難しく、独創的な新しいアイデアが必要とされていた。 本年度の目標は下記のようなものであった。 1.最適関数近似理論の理論限界の追求 2.最適化エンジンを含んだエキスパート付き決定木システムの設計と実装:二値属性の場合に知られている陰的な枝刈りの理論を数値属性の場合に拡張する。 3.非決定性を含んだ柔軟な決定木システムの設計と理論解析:Nondeterministicな決定木モデルにおける重み付けの最適化を解析し、精度限界の理論を与える。 1については、国際論文誌での論文発表を行い、また、サーベイ論文の執筆も行っている。 更に、関連した新しいグラフのクラスタリングと高濃度グラフ発見のアルゴリズムを成果として発見した。 2,3については、オンライン学習理論の利用を導入し、理論的な誤差評価を行うことに成功した。それに従い、陰的な枝刈りの新しいシステムを開発し、実験による検証も行った。
|