Research Abstract |
情報通信社会基盤の発展と,それにともなうデータ収集技術の進展により,データベース,データウエアハウスに格納されるデータ量は飛躍的に大きくなっている.大規模なデータから発見的な手法を用いて有用なパターンを発掘するデータマイニング技術は,データから未知の頻出パターンを発見し,その知見をビジネスに有効利用したいというニーズに支えられながら発展し,様々な分野で応用されている. マイニング対象のデータベースには,住所などの空間的な位置を示す属性,および,日付や時刻などの時間を示す属性が含まれていることが多い.従来のマイニング技術は,こうした時空間データを単なる文字列,あるいは数値,として扱い,時空間データが本来持っていた時間的,空間的な意味を充分に利用していなかった.本研究では時空間データを含むデータベースから時間や空間,あるいは時空間の相互関係に関する頻出パターンや最適値を発見するための新技術の開発を目標としている. 我々は,これまで空間的な頻出パターンの効率的な発掘アルゴリズムを開発してきたが,本年度は,前年度,実装した「時系列パターン」のアルゴリズムを,実際のPOSデータに適応した.データマイニングへの注目が集まっている反面,個人情報保護への関心も高く,近年は個人レベルでの購買履歴データをマイニングへ利用することが構造的に難しくなっているが,我々の手法は,個人データでなく集計されたからPOSデータから時系列パターンを発見できる手法としても利用できる.この成果は,データ解析コンペティションにおいて発表し,審査員特別賞を受賞した.また,本年度は,近年,注目を集めているセンサーネットワークへの応用についてフィージビリティスタディーを開始した.
|