2019 Fiscal Year Research-status Report
投稿群・投稿者群を単位するソーシャルメディア上の情報拡散のモデル化に関する研究
Project/Area Number |
19K20413
|
Research Institution | The University of Tokyo |
Principal Investigator |
榊 剛史 東京大学, 未来ビジョン研究センター, 客員研究員 (00735805)
|
Project Period (FY) |
2019-04-01 – 2021-03-31
|
Keywords | SNS / 情報拡散分析 / 社会ネットワーク分析 / ユーザ行動モデリング / 炎上 |
Outline of Annual Research Achievements |
本年度は,実績としての2つの項目を達成した.1.「どんなトピックでも精査せずに拡散してしまうユーザ」の存在に関する仮説の検証,2.「特定のトピックについて精査せずに拡散してしまうコミュニティ」の存在に関する仮説の検証である. 1.について,幅広くデータを収集するために,トピックを絞らず2週間のTwitter上の大規模情報拡散についてデータを収集した上で,その分類を行った.その結果,Twitter上の大規模拡散は大きく分けて「炎上」「キャンペーン」「イベント」の3種類に分けられることが分かった.また,それらの3種類には,情報拡散ネットワークの特徴に違いがあることが明らかになった.次に収集したデータを用いて「どんなトピックでも精査せずに拡散してしまうユーザ」の存在について検証を行った.具体的には「炎上」に分類される大規模情報拡散を対象として,複数の炎上に加担するユーザ群のを調査した.その結果,多くの炎上に加担するユーザ群が存在することが確認された.またそれらのユーザが属するコミュニティは政治的主張に特徴がみられた. 2.について,特定のコミュニティに属するユーザによる投稿を収集するために,メディアにより運用されているTwitterアカウントによる投稿を2週間収集し,それらの投稿の拡散したユーザ群を収集した.収集したデータを用いて,「特定のトピックについて精査せずに拡散してしまうコミュニティ」の存在について検証を行った.結果として,反応速度の中央値は,投稿内容や拡散規模によらず,メディアごとに一定の範囲内に収まるという結果が得られた.これより,「投稿を拡散する際に精査するかどうか」は,投稿のトピックではなく,ユーザの属するコミュニティに依存する可能性がある.つまり,ここでも「どんなトピックでも精査せずに拡散してしまうユーザ」が一定数いることが示唆された.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究進捗状況について,本年度実施予定であった内容の一部が進められていないが,他方,来年度実施予定であった内容の一部を前倒して進められている.これより,現在までの進捗はおおむね想定通りであると判断した.詳細な説明は下記である. 本年度は,情報拡散の事例を複数分析し,情報拡散パターンを明らかにしていくことが目標であった.研究実績の概要にもあるように,情報拡散パターンを大きく3つに分類することを達成し,さらに情報拡散のネットワークの構造特徴を用いることで,情報拡散のパターンが分類できるであろうという知見が得られている.この点においては,情報拡散パターン分類については予定通り達成している.しかし,情報拡散パターンの分類のために提示していた3つの要素については,特に分類には用いていない.3つの要素とは,「1.どんなトピックでも精査せずに拡散してしまうユーザ」「2. 特定のトピックについて精査せずに拡散してしまうコミュニティ」「3. どんなユーザでも精査せずに拡散してしまうトピック」である.その点では,本年度実施予定だった内容の一部を進められていない. これらの3つの要素のうち,1.,2.についてはその存在について個別に検証を行った.結果として,いずれの検証においても1.が重要な役割を担っていることが示唆された.この知見は,次年度実施予定の情報拡散パターンごとの拡散規模予測モデルの構築およびその対策立案に有用である.特に対策立案について,個別のユーザの行動傾向が原因の一つであることが分かっていれば,それに対して対策立案をすることは可能となるであろう.そのような意味で,情報拡散を構成する要素の存在を検証できたことにより,次年度の研究の一部を前倒して進められたと考えられる.
|
Strategy for Future Research Activity |
次年度は,A.情報拡散パターンの自動分類手法の確立,B.大規模情報拡散に寄与するユーザの特徴・行動特性の特定,C.A,Bに基づく拡散規模予測モデルの構築および対立案を実施する予定である. A.について,本年度の研究成果により情報拡散パターン自動分類の実現可能性が示唆されている.それに基づき,大規模情報拡散の分類のための正解データセットを構築した後,自動分類モデルの学習及び有用なネットワーク構造の特徴を明らかにする. B.について,A.により自動収集された大規模情報拡散データのうち,特に炎上を対象として,情報拡散の規模に寄与するユーザの特徴・行動特性を明らかにする.その過程において「3. どんなユーザでも精査せずに拡散してしまうトピック」の存在について検証を行う. C.について,特にB.ユーザの特徴・行動特性を用いて大規模な情報拡散が発生する過程をモデル化し,情報拡散の規模を予測するモデルを構築する.また予測に有用なユーザ特徴・行動特性を明らかにすることで,大規模情報拡散を防ぐための対策についても立案することを計画していてる. また新型コロナウィルス(COVID-19)に関するSNS上の情報拡散が社会的意思決定に影響を与えている現状を鑑みて,それらの投稿を新たに収集し,それらについても本研究課題のアプローチで分析し,有用な知見を獲得することを計画している. 最後に、研究の成果をまとめるとともに、国内学会・国際学会での発表,論文誌への投稿を行う.また研究過程で構築したデータセットについては,著作権や個人情報保護に反しない範囲で,多くの研究者が再利用可能な形で公開することを検討する.また,本課題提案者が所属する企業において,サービス化の可能性を検討し,可能な範囲で実サービスに組み込むことも想定してる.上記により,本課題の成果の公開・共有および社会実装を達成したいと考えている.
|
Causes of Carryover |
旅費の未執行分については,本年度末に2月~3月に2回の海外出張を予定していたが、新型コロナウィルスの感染状況を鑑みて,取りやめとした。物品費の予定外執行については、本研究課題で使用していたノートPCが故障し、修理期間に1ヶ月を要することが判明したため、急遽代替PCを購入したためである。人件費・謝金の未執行分については、情報拡散に関する大規模データの収集および整理に必要以上に時間がかかってしまい、正解データ作成(アノテーション)が実施できなかたっためである。その他の未執行分については、正解データ作成未実施により、それを用いた大規模モデル構築のためのクラウドサーバ利用が行われなかったためである。
本年度は、人件費・謝金およびその他の未執行分を用いて正解データの作成およびそれを用いたモデル構築を行う予定である。また旅費については新型コロナウィルスの感染状況が落ち着き次第、予定より多くの国際会議に参加する予定であるが、それが難しい状況であった場合、追加のデータを収集し、より大規模な正解データの生成およびモデルの構築を行う想定である。
|