本研究の背景には、実世界を連続的に観測することで大量に産出される科学観測データを網羅的に収集し、そこから意味のある情報や知見を抽出するための手法へのニーズが高まっている、ということがある。このような背景のもとで本研究は、特に「台風発生」という具体的な実世界問題に対象を絞り、画像データマイニングを用いて意味のあるパターンの発見を目指す。その成果は以下の3点にまとめられる。第一に、気象現象としても社会的にも注目を集める台風という現象を、気象観測データに基づき解析するための基本的なデータセットを構築したこと。特に気象衛星台風画像を網羅的に収集し即時的に更新していく台風時系列画像コレクションの構築は、世界に例がないユニークなものである。第二に、単なる台風データ検索エンジンを構築するのではなく、科学観測データに多様なテキストデータを連結していくことで、コンテンツに広がりを持たせたこと。例えば科学観測データの解説(ウェブログ)、ニュース記事の要約、現場からのレポートなどの多様なデータを、台風番号や地域などをキーとして科学観測データに結合することで、気象衛星画像や気象観測データの検索よりも高いレベルの検索、例えば「○○地方に高潮被害を与えた台風」といった検索を可能とした。第三に、台風発生の予兆発見という研究目的に向けて、台風発生直前のデータセットの整備を進め、それに対して画像データマイニング手法を適用したこと。これらの研究成果は、ウェブサイト(http://www.digital-typhoon.org)において一般にも広く公開している。このウェブサイトが1年間で1300万件近いページビューを獲得したことは、多くの人々がこの台風データベースの新規性と有用性を認めた結果であると考える。
|