研究概要 |
研究実績は以下の通り. 1.専門家からのフィードバックに柔軟に対応できるように,データ準備に必要な一連の前処理プログラムをフィルタの集合として整備し,データ準備の効率化を図った. 2.グラフ構造データ用決定木構築手法DT-GBIにBeam探索と枝刈り機能を追加し,肝硬変患者の同定,肝炎タイプの同定,インターフェロン効果の予測に適用し,構築した決定木の予測精度を交差検定により評価し,改良効果を確認した. 3.3次元グラフマイニング手法を実際の化学構造データの解析に適用し,適切な原子間距離のレベル分けが重要であるとの知見を得た. 4.肝炎時系列データの特徴が長期的に変化するデータと短期的に変化するデータで違うことをデータから見いだし,それぞれに適した抽象化表現および典型的な変化パターンを,分類するためのアルゴリズムを開発し,獲得される膨大な量の規則から統計的有意性に基き,より信頼性の高い規則を抽出した. 5.不規則間隔時系列データの別の抽象化手法として,スケールが自動的に調整できるウェーブレット変換を提案し,性能を評価し,ユークリッド距離により時系列を処理する他のアルゴリズムと比較し同等以上の精度が得られることを確認した. 6.名辞属性は値同士の関係が直接定義できずデータ間の類似性の測定は困難である.属性の確率分布を用い、2つの名辞属性値間の非類似度をそれらの条件付確率分布間の非類似性の総計として,2つのデータ間の非類似度をこの各属性値間の非類似度の総計として評価する尺度を提案した. 7.XMLベースのデータマイニシグプラットフォームMUSASHIを開発し,オープンソースソフトウェアとして公開した.また,MUSASHI上で動くCRMシステムC-MUSASHIのプロトタイプを開発した.多くのボランティアに支えられるMUSASHIユーザー会が発足し,日本における普及体制が整いつつある.
|