2008 Fiscal Year Annual Research Report
系列データからの頻出パターンの高速抽出アルゴリズムの開発
Project/Area Number |
08J03406
|
Research Institution | Hokkaido University |
Principal Investigator |
河東 孝 Hokkaido University, 大学院・情報科学研究科, 特別研究員(DC1)
|
Keywords | データマイニング / 系列データ / アルゴリズム / 知識発見 |
Research Abstract |
本研究の目的は,幅広い分野で利用されているさまざまな系列データベースから,自明でないが有意なパターンとして,頻出エピソードを高速に抽出することである. 本研究では,系列データベースから頻出エピソードを高速抽出するための基本的なアイデアとして,抽出対象の複雑なエピソードを,単純なパターンである直列エピソードに分解して抽出し,複雑なエピソードを再構成する直列構成という手法を用いた. はじめに,イベントの単純な列である直列エピソードを元にして高速に抽出できるエピソードのクラスを,直列構成可能なエピソードとして定式化し,直列構成可能なエピソードの理論的な性質を示した(PAKDD'08).次に,イベント列からエピソードの部分クラスである頻出菱形エピソードを高速に抽出するアルゴリズムを導入した.一つの出力から次の出力までの計算時間が入力長の多項式で抑えられるアルゴリズムを多項式遅延アルゴリズムという.本研究では,菱形エピソードが直列構成可能なエピソードであることを利用して,イベント列から頻出菱形エピソードを多項式遅延・多項式領域で抽出するアルゴリズムを導入した(PAKDD'09).最後に,医療分野にエピソードマイニング適用して,院内感染の原因である菌交代に関するエピソードを抽出した.病院のシステムの自動化に伴い,実験に使用している系列データベースには毎年多数の新しいデータが蓄積される.そこで,大阪府立急性期・総合医療センターより提供された最新の細菌検査データから,菌交代に関する直列エピソードを抽出する実験を行い,最新の菌交代発生パターンを医療関係者に提供した(CME'09).
|
Research Products
(6 results)