研究概要 |
本研究は,蓄積された膨大な多次元時空間情報を自動的に分類しその共通性を可視化する新たな時空間データマイニングシステムについて研究開発を行い,従来困難であった時空間軌跡の横断的比較による知見獲得を可能とすることを目指すものである。 研究初年度である平成19年度では,データウェアハウスサーバの設置及びデータ利用環境の整備を行った後,現有手法の問題点の分析と,多次元,多変量時空間データの分類を実現する方法の開発に着手した。そのプロトタイプとして,(1)時空間情報の軌跡表現,(2)構造的類似性に基づく部分軌跡の最適対応獲得(多重スケール構造比較),(3)部分軌跡ごとの系列値差に基づく相違度導出,(4)相違度に基づくクラスタリング,の4ステップからなる多次元時空間データの比較分類システムを構築した。開発したシステムを用い,慢性ウイルス性肝炎症例の時系列データ(アルブミン値,血小板数の2次元軌跡)のクラスタリング実験を行った結果,生成されたクラスタの構成と肝線維化度の間に関連が見られたこと,また,線維化度の高い事例を多く含むクラスタでは他のクラスタに比べて軌跡に明瞭な方向性が見られたことなど,興味深い知識が獲得された。これらの結果を,IC-MED Journal,米国医療情報学会(AMIA)年次大会,米国電気電子学会(IEEE)医療におけるデータマイニングに関するワークショップ及び情報処理学会全国大会にて発表した。
|