2010 Fiscal Year Annual Research Report
系列データからの頻出パターンの高速抽出アルゴリズムの開発
Project/Area Number |
08J03406
|
Research Institution | Hokkaido University |
Principal Investigator |
河東 孝 北海道大学, 大学院・情報科学研究科, 特別研究員(DC1)
|
Keywords | データマイニング / 系列データ / アルゴリズム / 知識発見 / 列挙 |
Research Abstract |
本研究の目的は,幅広い分野で利用されているさまざまな系列データから,自明でないが有意なパターンを高速に抽出することである.本年度の研究では,有向グラフとして定義されるエピソードの部分クラスである多部エピソードのマイニングアルゴリズムを,医療データである細菌検査データへ適用することで,院内感染の原因である菌交代現象を捕らえるエピソードの抽出実験を行った. 自然数k≥1に対して,A_i(1≤i≤k)をイベントの集合とする.このとき,という形のエピソードをk部エピソードという.k部エピソードは,自然数1≤i中のすべてのイベントはA_iのすべてのイベントが出現した後に出現することを意味するエピソードである. 本研究では,入力イベント列に頻出するすべての多部エピソードを高速に抽出するアルゴリズムを導入した(JSAI'10).さらに,エピソード抽出アルゴリズムを医療データに適用することで,院内感染の原因と考えられている菌交代現象に関する時系列規則を表す頻出エピソードを抽出した.具体的には,制約付きの多部エピソードに関するマイニングアルゴリズムを導入し,アルゴリズムを大阪府立急性期総合医療センターから提供された1999年から2007年までの164713レコードからなる細菌検査データに適用することで,菌交代現象に関する時系列規則の抽出実験を行った.その結果,菌交代現象を捉える多数の時系列規則の抽出に成功した(CME'10).
|
Research Products
(6 results)