研究課題
オンライン時系列ビッグデータは,実社会における様々な分野で大量に発生している.例えば,Webサービスの代表であるGoogleの検索数は毎日30億クエリを超え,ソーシャルメディアサービスTwitterには,3億近くのアクティブユーザから5億件以上のTweetが日々生成され続けている.これらのオンライン活動データは,現実世界のニュース,季節性等を含む様々な実社会活動と連動し,リアルタイムに変化,推移している.このようなWeb情報の時間発展の解析は,特定のビジネスのみならず,社会経済の活性化,行政,環境,防災など,重要な社会問題を解決するための効果的なアプローチとして期待されている. 本研究では,オンラインネットワーク内において大量かつ高速に生成され続けるオンライン時系列ビッグデータストリームを対象とし,Web上に現れる多種多様で複雑な時系列パターンの中から,社会的に重要な情報を高速かつ自動的に抽出・発見することで,社会活動の動向をリアルタイムに分析・予測するための基盤技術を開発する.本年度は主に研究の基礎理論の確立を目指すと同時に,国内外での研究議論,発表を活発に行った.より具体的には,研究課題の基盤技術として,主に大規模非線形時系列データストリームのための特徴自動抽出と予測を行う手法を開発した.研究論文に関しては,データマイニングの分野で国際的に最も権威のある国際会議ACM SIGKDDにへの採録が決定した.
2: おおむね順調に進展している
本年度はオンラインアクティビティのダイナミクスを表現するため,これまで開発した非線形モデル学習とリアルタイム予測の技術を改良,発展させ,より高度かつ複雑な時系列パターンを多角的に表現,解析することを可能とする非線形解析技術を開発した.また,研究論文に関しては,データマイニングの分野で国際的に最も権威のある国際会議ACM SIGKDDにへの採録が決定し,国際的にインパクトの高い研究成果となった.
本年度に開発した解析技術は,リアルタイムに非線形性を有する時系列データストリームを学習することができ,既存手法と比較し,より多様かつ複雑な時系列パターンを表現する能力を有する.そこで今後は,さらに高度な時系列データとして,高次元データや数値データのみならずカテゴリカルな値を付与された時系列データ等のモデル表現についても検討し,より柔軟にオンライン時系列ビッグデータを解析できる基盤技術を開発する.
すべて 2019 2018
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (4件) (うち招待講演 2件)
情報処理学会論文誌:データベース, 2018, Vol.11 No.1, pp. 1-10, 2018, 4月17日.
巻: 11 ページ: 1-10