研究課題/領域番号 |
23K21728
|
補助金の研究課題番号 |
21H03559 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 千葉商科大学 |
研究代表者 |
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
研究分担者 |
宇野 毅明 国立情報学研究所, 情報学プリンシプル研究系, 教授 (00302977)
栗田 和宏 名古屋大学, 情報学研究科, 助教 (40885266)
小林 亮太 東京大学, 大学院新領域創成科学研究科, 准教授 (70549237)
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
申 吉浩 学習院大学, 付置研究所, 教授 (60523587)
|
研究期間 (年度) |
2021-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
16,900千円 (直接経費: 13,000千円、間接経費: 3,900千円)
2025年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2024年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2023年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
2022年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
2021年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
|
キーワード | ソーシャルメディア / データマイニング / ビッグデータ解析 / 集合行動 / 反応分析 / ソーシャルメディア分析 / データ研磨 / 時系列分析 / Tweets全量分析 / 多様性評価 / Twitter全量分析 / 多様性 / 話題抽出 |
研究開始時の研究の概要 |
本研究では、意味理解ではなく、集合行動のメカニズムや特徴の理解により、SNS上のデマや誹謗中傷といった行動を捉える手法を開発する。集合行動発生時に観測されるSNS上の話題構造に注目し、多様性の低下や対立、急激な成長といった構造及びその変化をモデル化することで集合行動を可視化する。複数のSNSを対象とし、自然言語的・社会ネットワーク的な時系列データにおけるコミュニティやバーストのような局所的・大域的な構造から算出可能な形質情報(クラスタ数、占有率、類似度など)を用い、話題を構造化する。意味理解の困難さを避けることで、新たなタイプの集合行動や、他言語への対応も容易となる。
|
研究実績の概要 |
本研究は数億件規模のソーシャルメディアデータを対象とし、コロナの感染や選挙といった災害や時事問題からユーザの反応の時系列分析を行うものである。最終的には、予期しない出来事によって起こされる非合理的でかつ偶発的な理不尽な行動(集合行動)を検知する手法を開発することを目指す。提案手法は大規模データに対して安定したクラスタリングを行う手法として広く使われつつあるデータ研磨(マイクロクラスタリング手法)を用い、時系列クラスタリング手法と融合することで、2段階でクラスタリングを行い、話題の変遷や時系列推移を俯瞰する。コミュニケーションの意味的な評価も加え、人をよりWell-beingとする「ソーシャルメディア上での人々の反応モデル」を構築している。2023年度は、ワクチン接種、オリンピック、選挙といった大きな時事問題の前後での人々のSNS上での反応を分析するために、大規模Tweetsを対象とした実験を行った。特にワクチンの場合は、職域接種の開始タイミング、オリンピックでは、開会式、選挙では総選挙実施日といったイベントの前後で、人々の話題や反応がどのようであったかを分析している。大きなイベント前後の反応の違いについて、モデル化を行っている。実験結果をまとめ、ジャーナル論文化する予定であったが、実験の準備及び実行、さらに結果を英語化するために想定以上の時間を要してしまい、論文提出には至らなかった。現在、論文を執筆中である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
Twitterの全量データを対象として、我々が提案してきたTwo-stageクラスタリング手法を用いて、ワクチン接種やオリンピック、選挙といった大きな時事問題に対する人々の反応を抽出できたことは非常に大きな成果であった。一方で、結果の評価 → 実験のやり直しといったサイクルが複数回発生してしまい、また、英文ジャーナルへの投稿も踏まえたデータの英語化等に時間を取られてしまい、Two-stage クラスタリング手法の実験結果を論文化できなかったことは、若干の遅れと言える。 Two-stage クラスタリング手法の実験は、大規模データを対象とした実験であり、実験に多大な時間がかかる。研究を効率的に実施できる環境は構築できたので、今後は加速化可能と考える。
|
今後の研究の推進方策 |
1.Two-Stage Clustering 手法の効果確認と公開(論文発表) 2024年度は、2023年度に行った大規模Tweets分析の実験結果、それに基づき作成中の論文を完成し、時事問題の種類による人々の反応の違いや、パターン化を論文として公開し、英文ジャーナルに投稿する。それにより、SNSが時事問題に与える影響や、人々の集合行動把握へとつなげていく。
2.SNS上で発生する集合行動の分類・整理の精緻化 Two-Stage Clustering手法の分析結果を受け、SNS上でどのような集合行動が発生しているか、その際に対象話題に対してどのような構造変化が起きているかの観察・分析・整理を行い、集合行動を把握するためのモデル化の基礎となる概念の体系化を行う。社会科学的観点から集合行動を調査・考察し、SNS上での人々の集合行動が誘発するであろう現象の考察と、それらの現象をTweet以外の他のソーシャルメディア実データでの検証も行う。
|