2018 Fiscal Year Annual Research Report
Development of Methods for Social Information Analysis and Behavior Prediction Based on Web Information
Project/Area Number |
18H03245
|
Research Institution | Kyoto University |
Principal Investigator |
田島 敬史 京都大学, 情報学研究科, 教授 (60283876)
|
Co-Investigator(Kenkyū-buntansha) |
櫻井 保志 熊本大学, 大学院先端科学研究部(工), 教授 (30466411)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | オンライン・アクティビティ抽出 / ユーザ行動追跡 / 情報の需要と供給 / ソーシャルメディア分析 / 時系列ビッグデータ解析 / データストリーム予測 / リアルタイム要因分析 |
Outline of Annual Research Achievements |
Web上の情報の時間変化から現実社会の事象に関する因果関係を発見するためのアプローチの一つとして,サーチエンジンへ入力される検索語の変化を用いる方法を検討した.その準備として,まず,検索頻度が急に上昇した語と現実社会の事象の間の関係についての調査を行った.その結果,ある語を含む新規Webページの出現頻度は大きく変化していないにも関わらず,その語の検索頻度のみが急上昇した場合には,なんらかの現実世界の事象が関係していることが多いことがわかった.この結果を元に,Web上での情報の出現と検索,すなわち需要と供給の間の時間的関係についての調査を開始し,これについては次年度も引き続き行う予定である.また,Twitterなどのマイクロブログの投稿列からユーザの行動を追跡するために,各投稿から最も重要な語を選別する技術を開発した.開発した手法では,投稿内で重要な役割を果たしている語は,その語が表すトピックと投稿全体のトピックとの類似度が高いという仮定に基づき,重要な語を判定する.また,投稿内容と,その投稿後の投稿主への注目度の短期的および長期的な変化との間の関係に関する分析を行った.これについても,次年度も引き続き,研究を続ける予定である.Webから抽出した情報の時系列マイニング技術に関しては,ビッグデータから時系列モデル間の因果関係を捉え,事象の連鎖をモデル化する新しい時系列解析手法を確立した.さらに,様々なイベント発生の兆候をビッグデータから高速かつ自動的に抽出するためのリアルタイム要因分析技術,そしてプロトタイプシステムを開発した.本研究成果は,データマイニングのトップ国際会議であるKDD 2019に採択済みである.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
おおむね順調に進展している.ただし,大規模ソーシャルグラフの時間変化の分析技術に関する研究については,大手ソーシャルメディアサービス会社のデータアクセスに関する規約変更などにより,データの収集が遅れている.
|
Strategy for Future Research Activity |
引き続き,Web上での情報の需要と供給の時間的関係の分析や,ソーシャルメディアのデータからのユーザのアクティブティの追跡に関する研究を行う.大規模ソーシャルグラフのデータの収集方法については,収集方法の変更について,現在,検討中である.
|