研究概要 |
本年度は以下の二点についての研究・開発を行った。 1.データマイニングソフトMUSASHIの拡張 昨年度,関西学院大学内に設置したビジネスマイニング研究センターの枠組みの中で,MUSASHIのコア機能の拡張開発を行った.具体的な拡張点は以下の通り.a)スレッド間通信によりマイニングモジュールを組み合わせるためのAPIの実装,b)MUSASHIが従来採用していたXML tableをより簡素化したCSVデータフォーマットの高速入出力APIの開発,c)いくつかのマイニングモジュールの上記APIを利用しての再実装,d)上記APIをPHPから利用するためのPHPエクステンションの開発.なお,開発プログラミング言語は,アルゴリズムの効率的な実装の観点からC++を採用した.またシステム体系及びデータ構造の大幅な変更を行ったため,また旧来のソフトウェアとの混乱を避けるため,ソフトウェアの名称をKGMODに変更することにした.今後,APIの公開に伴う作業(公開Webサーバーの構築,ドキュメントの充実,利用方法の文書化,応用ソフトウェアの構築など)を中心に進めていく. 2.データマイニングアルゴリズムの開発および応用 分類階層(taxonomy)を考慮に入れたEmerging Pattern(顕在パターン)列挙アルゴリズムを開発し,それに基づく判別モデル構築手法を構築した.Webログデータ,レセプトデータ,犯罪データなどに適用し,その有効性を確認した.次年度にはIndexingを取り入れたtaxonomy自動生成アルゴリズムを追加開発する予定である.また多次元voxelの標本分布の単峰近似関数(通称「ピラミッド」)による分類モデルの開発および実装を済ませた.応用研究は次年度の課題とする.
|