研究概要 |
昨年度に引き続きコンピュータシステムで記録される様々な種類のデータから特徴抽出を行うデータマイニングに基づく手法の開発と実験を行った.具体的なデータとしては,「キーストロークデータ」および「ブログデータ」を扱った.キーストロークデータについては,セキュリティ向上のためユーザ判定を目的とし,キーストロークからユーザの特徴を抽出する試みを行った.その際,プライバシの観点からキーストロークによって得られる文字情報を使わず,タイミングのみを用いてユーザの特徴を抽出する手法の開発を行った.実験の結果,ある程度のユーザ特定を行えることが判明した.しかし同時に,文字情報を用いらずにユーザを特定することの限界も判明した.会社など,組織内での実際の導入を考慮した場合,プライバシに関する問題は少ないと考えられるため,文字情報も有効に活用させながらユーザ判定の精度を向上させることが必要であるとの課題も明らかになった. キーストロークデータは,時系列データの一種として見なすことができ,上述の研究で開発した手法を他の時系列データにも応用が可能である.その応用例の1つとして「ブログデータ」における解析を行った.具体的には,大容量のブログデータから話題のトピックを抽出する手法の開発,実験を行った.提案手法は,ブログで話題にされている様々なトピックの中から特に注目度の高いトピックを抽出し,さらにその時系列的な関係性を導き出すことを可能にする.実験として,歴史的な事件が起こったことが分かっている期間に投稿されたブログデータを解析し,提案手法が有効であることが確かめられた.
|