2015 Fiscal Year Research-status Report
系列データの動的ネットワーク化による高階データマイニング
Project/Area Number |
26330262
|
Research Institution | Nihon University |
Principal Investigator |
尾崎 知伸 日本大学, 文理学部, 准教授 (40365458)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | データマイニング / パターンマイニング |
Outline of Annual Research Achievements |
本研究は、ソーシャルメディアに代表されるテキストストリームやセンサーネットワーク等から得られる多次元時系列データを対象に、高度な知識獲得を実現するための基礎技術として、多様な関連性を利用した系列データの動的異種多次元ネットワーク化技術を開発することを目的としている。この目的達成のため、本年度は、1. 部分類似区間に着目した系列データの区間イベント系列化とグラフパターンの検出および2. ソーシャルメディアにおけるバースト現象の分析を行った。 1. に関しては、多次元時系列データ中の各系列対を対象に、部分類似区間を抽出した上で記号化することで、時間幅を持つ区間イベント系列へと変換する技術を提案した。また得られた区間イベント系列を対象に頻出系列パターンを発見する技術や区間イベント系列をさらに動的グラフへと変換しグラフパターンを発見する技術を提案した。 2. に関しては、代表的なソーシャルメディアの一つであるTwitterを対象に、ツイート系列をリツイートやメンション、URLの有無などの観点から多次元時系列へと変換した上で、特に野球に関するツイートのバースト現象について、その傾向や原因をよりミクロな観点から分析した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
これまでに、時系列データを記号化した上で複合的なパターンを発見するという基礎技術を実現している。加えて、パターンマイニング技術の整備や実データを対象とした初期的な実験を行っている。しかし、大規模な実験や対外発表は必ずしも十分ではなく、その点でやや遅れていると考えている。
|
Strategy for Future Research Activity |
今後は、大規模実験による基礎技術の総合的な検証を行う。また、複合構造パターン発見を中心に、高階パターン発見技術の高度化を目指す。さらに、計算時間を短縮するためにGPU等を用いた並列化を検討する。これらを踏まえ、研究全体のまとめを行う。
|
Causes of Carryover |
本年度は必ずしも対外発表が十分ではなかったことにより、当初の予定と執行額が異なる結果となった。
|
Expenditure Plan for Carryover Budget |
研究を促進するため、大学院生による実験補助と、実験環境の強化のための計算機の購入を予定している。また、海外発表を中心に積極的に対外発表を行うとともに、それらをとりまとめ、雑誌論文の執筆を行う。
|