2004 Fiscal Year Annual Research Report
時空間情報をもつデータベースからの頻出パターン発掘アルゴリズムの研究
Project/Area Number |
16700145
|
Research Institution | Hiroshima University |
Principal Investigator |
森本 康彦 広島大学, 総合科学部, 助教授 (00363010)
|
Keywords | データマイニング / 相関ルール / 時空間情報 / 時系列パターン / 最適化 |
Research Abstract |
情報通信社会基盤の発展と,それにともなうデータ収集技術の進展により,データベース,データウエアハウスに格納されるデータ量は飛躍的に大きくなっている.大規模なデータから発見的な手法を用いて有用なパターンを発掘するデータマイニング技術は,データから未知の頻出パターンを発見し,その知見をビジネスに有効利用したいというニーズに支えられながら発展し,様々な分野で応用されている. マイニング対象のデータベースには,住所などの空間的な位置を示す属性,および,日付や時刻などの時間を示す属性が含まれていることが多い.従来のマイニング技術は,こうした時空間データを単なる文字列,あるいは数値,として扱い,時空間データが本来持っていた時間的,空間的な意味を充分に利用していなかった.本研究では時空間データを含むデータベースから時間や空間,あるいは時空間の相互関係に関する頻出パターンや最適値を発見するための新技術の開発を目標としている. 我々は,これまで空間的な頻出パターンの効率的な発掘アルゴリズムを開発してきたが,2004年度は,それを発展させ,時間の経過とともに推移するパターン発掘のアルゴリズムの研究を進めた.具体的には,データベース中に存在する任意の2事象の間に,その他のどんな事象が,どのような順序で発生すると,その2事象の発生が最大化されるかという点に着目した最適化問題をとく効率的なアルゴリズムを開発した.
|