2016 Fiscal Year Annual Research Report
Pattern mining in dynamic networks constructed from sequential data
Project/Area Number |
26330262
|
Research Institution | Nihon University |
Principal Investigator |
尾崎 知伸 日本大学, 文理学部, 准教授 (40365458)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | データマイニング / パターンマイニング |
Outline of Annual Research Achievements |
本研究課題は、テキストストリームや多次元時系列データを対象とした高度な知識獲得を実現するための基礎技術として、系列データの動的異種多次元ネットワーク化技術と構造パターンマイニング技術を開発することである。この目的達成のために、これまでに、部分類似区間に着目した系列データの区間イベント化アルゴリズムの開発や、ソーシャルメディアにおけるバースト現象の分析等を行った。今年度はこれらを発展させ、1.区間イベント系列からのパターン発見アルゴリズムの開発、2.部分グラフマイナーの並列実装、3.ソーシャルメディア、ニュース記事、株銘柄を対象とした動的ネットワーク化技術の開発を行った。 1.に関しては、系列対から部分類似区間を抽出・記号化することで、多次元時系列データを区間イベント系列へと変換する技術を開発した。また得られた区間イベント系列から、頻出する部分区間系列パターンを抽出する技術を開発し、これらを株価データへと適用した。 2.に関しては、頻出部分グラフパターン列挙の代表的なアルゴリズムgSpanのGPU実装を行い、系統的なテストデータセットを用いてその性能を評価した。さらに実装したシステムを拡張し、頻出パターンの圧縮表現であるノイズ許容飽和パターンの並列実装を実現した。 3.に関しては、LDAを用いてTwitterとニュース記事をトピック系列化した上で、移動エントロピーに基づき株銘柄との関連性を評価することで、株銘柄、Twitterにおけるトピック、ニュース記事におけるトピックの動的3部グラフを構成する技術を開発した。またコミュニティ発見等のネットワーク分析を利用し、これらの関係の分析を行った。
|