現実の社会におけるデータベースの大規模化やデータ収集技術の進歩にともない、「蓄積されたデータから知識を獲得すること」、すなわちデータ・マイニングの重要性が増していることに着目し、既存のルール導出のアルゴリズムの性能を計算量の側面から再評価し、それらの効率を向上させることなどを初年度(9年度)の目的とした。 このテーマのもとで、これまでの研究について調査を重ねるうちに、複数のコンピュータに分散して配置されたデータを統合して、意味のある知識や情報として入手するまでの過程を効率化する問題に、これまで考慮されていなかった未提案・未解決の問題があることを発見した。この問題を組合せ最適化の手法やグラフ理論の枠組みを用いて定式化することに成功した。これを行なう過程で、9年度の科研費で交付された補助金によりデータベース理論やアルゴリズム論に関する書籍を購入し、過去の手法などを綿密に調査した。また、テーマを共有する研究者と再三にわたる討論を必要とし、このために旅費を使った。 その結果、上記の問題を計算の複雑さの観点から厳密に評価することに成功し、その問題を解く効率的な方法を考案することができた。このことは、来年度に予定している、分散したデータから意味のあるルールを獲得できることを保証するようなデータの分割・保持の研究とも密接に関連している成果であるといえる。また、9年度の交付金により高性能のコンピュータを導入することができたので、われわれの方法の有効性を計算機実験で実証することは10年度の目的の一つでもある。なお、研究成果も10年度にかけて順次公表の予定である。
|