研究課題/領域番号 |
18K11560
|
研究機関 | 国立情報学研究所 |
研究代表者 |
小林 亮太 国立情報学研究所, 情報学プリンシプル研究系, 助教 (70549237)
|
研究期間 (年度) |
2018-04-01 – 2022-03-31
|
キーワード | ソーシャルメディア分析 / トレンド / 時系列モデル |
研究実績の概要 |
Web上では、時々刻々膨大な量のコンテンツ (1分間にTwitter では45万以上のツイート, Youtube では400時間以上の動画が投稿されている) が生まれている。将来どのようなコンテンツが人々の興味を引くかを予測できるようになれば、マーケティングや魅力的なWebコンテンツの作成を効率的に行うことができるようになるだろう。本研究では、ソーシャルメディアに着目し、「将来のトレンド (Twitter におけるハッシュタグの流行など) を予測できるのか?」 という問いを設定して研究を進める。 2018年度は、ソーシャルメディアにおけるトレンドについての時系列モデルを構築するため、共同研究者であるPrzemyslaw A. Grabowicz博士 (マサチューセッツ大, 米国) が所有するハッシュタグ情報付きのTwitterデータを分析した。このデータは時系列モデルを構築するために取得されたものではないこともあり、規模の大きなハッシュタグ活動がデータには含まれておらず、時系列モデルを構築するにはデータ量が不十分であった。 このため、ハッシュタグ情報が利用できないツイートデータを活用できないか検討した。関連する研究成果として、ハッシュタグ情報が利用できない場合でも、大量のツイートデータから自動的にトピック分類を行い、それぞれのトピックトレンドを抽出するデータ分析技術を開発することに成功した。 本研究は、David Adelani氏 (ザールラント大, ドイツ)、Grabowicz博士との共同研究である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
上述したように、共同研究者が所有するTwitterデータは、時系列モデルの構築にはデータ量が十分ではない事が判明したため。しかしながら、当初に予想していなかった研究成果 (ツイートデータから自動的にトピック分類、トレンド抽出を行うデータ分析技術) を得ることができた。
|
今後の研究の推進方策 |
まず、得られた研究成果 (ハッシュタグ情報を利用することなく、トピックのトレンドを抽出するデータ分析技術) についての論文を完成させ、論文誌あるいは国際会議に投稿することを目指す。 その後、開発した技術を大規模Tweet データに適用することにより、トピックトレンドを抽出し、トレンドの時系列モデルの構築を行うことを試みる。また、Twitter以外のWebデータを用いて、トピックトレンドの時系列モデル構築ができないかどうか検討する。引き続き、大規模なWeb・ソーシャルメディアデータを保有している研究者 (Grabowicz博士やRenaud Lambiotte教授 (オックスフォード大) 等) との共同研究を試みる。
|
次年度使用額が生じた理由 |
当初計画では、2018年度には、1) Grabowicz博士が当時所属していたマックスプランク研究所 (ドイツ) を訪問すること、2) 共同研究の成果を国際会議で発表することを予定していた。しかしながら、2018年度にGrabowicz博士がマサチューセッツ大学へ異動することが決まり、また、前述したように研究進捗が遅れたため、これらの出張を2019年度以降に延期することにした。 2018年度に計画していた旅費は、Grabowicz博士や共同研究者であるDavid Adelani氏、Renaud Lambiotte 教授と打ち合わせを行うための旅費および招聘の費用に充てることを計画している。
|