研究概要 |
多視点・多粒度型知識発見のためのデータマイニング手法として,データの重要部分を確率的クラスタリングにより要約し,情報量規準をもとに色相を割り振る方法を考案した.この方法は,医療検査データで有効性が示されたわれわれのプロトタイプラインの拡張となっている,提案手法を,同じくシーケンスデータであるウェブセッションデータに適用し,不正アクセスが発見されやすくなることを確認した. さらに,テキスト画像データであるウェブページデータを対象とし,重要部分に関する確率的クラスタを文書トッピクと見なして,提案手法の有効性を調べた.なお,ウェブページには画像や単語など固有の有用情報があるために,これらに関しては別途可視化手法を開発し,提案手法と統合した.被験者実験の結果,提案システムは一般に用いられているGoogleに比較して再現率,適合率,および発見時間の全てにおいて優れていることが示された. その他,商業用データへの応用を視野に入れ,仏国カン大学と協力してアイテム集合トランザクションデータへの適用に関する研究を進めた.時空間データへの適用のために,高校サッカーに関してはデータの取得と重要部分抽出手法の開発,ミニカーサッカーに関してはデータ取得用テストベッドの製作と動画像要約手法の開発を行い,いずれも被験者を用いた予備実験で有望な結果を得た.さらに関連基礎技術の調査も行った.
|