研究課題/領域番号 |
18K11560
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 東京大学 (2020-2023) 国立情報学研究所 (2018-2019) |
研究代表者 |
小林 亮太 東京大学, 大学院新領域創成科学研究科, 准教授 (70549237)
|
研究分担者 |
篠本 滋 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究員 (60187383)
|
研究期間 (年度) |
2018-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2018年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | ソーシャルメディア分析 / Webデータ分析 / 時系列モデル / フェークニュース / 情報拡散 / 社会ネットワーク分析 / 計算社会科学 / 時系列分析 / トピックモデル / トレンド / ウェブマイニング / 時系列解析 / 機械学習 |
研究実績の概要 |
本研究では、ソーシャルメディアの将来のトレンド (X: Twitter におけるハッシュタグの流行など) を分析、予測するための方法論の開発を進めている。2023年度には2つの方向から研究を進めた。 まず、1つ目の方向として、複数のコンテンツ (ツイート, 動画など) の関係性を分析する研究に取り組んだ。これまでの関連研究では、それぞれのコンテンツを1つの時系列と扱い、その拡散現象を分析したものが多かった (Lehmann et al. 2012; Kobayashi and Lambiotte 2016; Candia et al. 2019など)。コンテンツ間の関係性を抽出できれば、その関係性を分析することで流行現象のメカニズム理解につながったり、予測精度のさらなる向上に繋がったりすることが期待される。2023年度には、ハッシュタグの投稿履歴に関するビッグデータを収集した。そして、収集したデータを多変量時系列として分析を進めた。 次に、2つ目の方向として、投稿内容 (ツイート, 動画などの内容) を考慮に入れて分析を行う方法の開発を進めた。これまでの関連研究では、キーワードやハッシュタグなど (Lehmann et al. 2012) に基づいて分析されてきた。キーワードやハッシュタグに基づく分析には、1) 分析者が適切なキーワードを設定する必要がある、2) ハッシュタグをつけていない投稿は無視される、など限界点も多い。そこで、2023年度には、ツイートなどのテキストデータに着目し、大規模言語モデルを用いたベクトル埋め込みを行うことにより、投稿内容を考慮に入れてトレンドの分析を行う方法の開発を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2023年度には、海外から共同研究者を日本に招聘したり、海外の共同研究者 (Ghent大学、Oxford大学) を訪問したりするなど海外の研究者との交流を再開することができ、研究を順調に進めることができた。また、研究成果についても順調に発表できた。 研究実績の概要で紹介した、1つ目の方向 (複数のコンテンツ間における関係性の分析) については、研究成果を国際会議で発表することを予定している。また、2つ目の方向 (投稿内容を考慮に入れて分析を行う方法の開発) については言語処理学会で発表を行った。
|
今後の研究の推進方策 |
まず、研究実績の概要で紹介した2つの研究成果を論文の形にまとめ、国際会議や学術誌などに投稿する。その後、複数のコンテンツ間における関係性を活用したトレンド予測技術の開発に取り組みたい。
|