Research Abstract |
本研究は,データマイニング研究の1つとして,大規模なビジネスデータへ適用できる汎用的なグラフマイニング手法を開発することである.その基本的な枠組みに関しては,これまでの研究で提案しており,大きく2つの特徴を有する.1つ目は,対象とするデータをグラフ構造データへと変換する点である.2つ目は,変換したグラフ構造データから遺伝的アルゴリズムを用いて有効な解を発見する点である,これまで,クレジットカードの購買履歴データに提案手法を適用し十分な結果を得ることができた.そこで本年度は,汎用的な手法としての完成を目的に,異なるデータに提案手法を適用することで,その有効性を検証した. 提案手法を適用したデータはあるサイトで蓄積されたWEBログデータである.WEBログデータは,ユーザのサイト内の閲覧行動を蓄積したものであり,ページをノード,ハイパーリンクを有向枝とする有効グラフで,各ユーザの巡回行動が表現可能である.この点からは,上述した提案手法の特徴であるグラフ構造への変換の必要はないが,サイトは膨大なページとハイパーリンクから構成されており非常に複雑であるため,まず有向グラフを縮約することで主要なサイト構造を特定した.その後,抽出したサイト構造に提案手法を適用することで,目的とするイベントに反応するユーザと,反応しないユーザに特徴的な巡回行動をパターンとして抽出した. 結果としては,抽出されたパターンの中で,イベントに反応するユーザに特徴的なパターンを解釈することで,「イベントに反応するユーザは,ある特定のページを閲覧し,異なるページを閲覧した後に再びそのページを閲覧する」など,いくつかの新たな知見が得られた,このような知見は提案手法を適用することで明らかになった点であり,異なるデータに対しても提案手法の有効性を示すことができた.
|