研究概要 |
大量データから知識を発見するためのデータマイニングの研究は,表などの単純な構造のデータからグラフ構造などのより複雑な構造を持ったデータへと展開してきている。今後,その発展が注目されるもののひとつに時空間データがある。時空間データは時間・空間の両方に依存するデータであり,理工学や実社会のあらゆる局面で大量に生成されるため,その有効利用のために,データマイニングのアプローチが期待されている。 本研究では,長年にわたり蓄積され,適切に校正された地球観測衛星のデータをテストベッドとして時空間データマイニングのフレームワークおよび時空間知識発見の支援システムの検討を行った。対象としては高知大学において10年間に渡り蓄積された気象衛星による雲画像と米国のNOAAシリーズ衛星によって蓄積された22年間に渡る植物活動の活発さを示す植物指標のデータを用いた。 3年間の研究により,時空間データマイニングの重要な要素として,(1)時間連続性を考慮に入れた半自動的なオブジェクトの抽出と追跡,(2)植生指標のようなノイズと欠落を大量に含み,長期的に変動するデータの統計学的なモデリング,(3)時空間の相関性の分析,(4)抽出されたパターンの3次元可視化環境での表現によるインタラクティブなビジュアルデータマイニングなどが実現された。このように,気象・植生などの時空間データに対するアルゴリズムの開発と可視化環境を整えることができたが,本格的な大量データでのマイニングの実施には及ばなかった。今後,引き続き計算グリッドなど計算資源の整備により,本格的なデータマイニングを実施できる環境を構築し,さらにその構成要素の研究を進めていく予定である。
|