本年度は,まず,アンチバイオグラムの特徴である,各レコード中に同一アイテムが重複した出現を許すことに着目し,各レコードを重集合とみなしたパターン発見に取り組んだ.重複出現を許さないトランザクションデータベースからの相互依存アイテム集合の抽出を重集合に拡張し,特に重集合の性質を利用した末尾出現の概念を導入して探索の枝刈りをすることで,アンチバイオグラムから高速に相互依存重集合を抽出するアルゴリズムを設計・実装した.このアルゴリズムは,頻出する頻出重集合を抽出することも可能であり,結果として,アンチバイオグラムから頻出相互依存重集合を抽出することも可能である. そして,このアルゴリズムを実際のアンチバイオグラムに適用することで,院内感染のパターンの一つである菌交代を示唆するような緑膿菌と黄色ブドウ球菌を共に含む相互依存重集合を発見することに成功した. さらに,アンチバイオグラム以外のデータとして,ベンチマークデータにおけるアイテムを重複させることで重集合としたデータにこのアルゴリズムを適用することで,適用可能性が高いことを示した. また,今後アンチバイオグラムに適用することを考慮し,インフルエンザウイルス塩基配列からの一貫性に基づく特徴選択についての研究を展開した.まず,一貫性に基づく特徴抽出を組合せ最適化問題として定式化し,その拡張として,反復特徴選択の手法を設計・実装した.そして,塩基配列の観測日をクラスラベルとすることで,特徴として時間に伴うインフルエンザウイルス塩基配列位置を選択することができた.
|