2021 Fiscal Year Annual Research Report
ランダムウォークサンプリングに基づくソーシャルグラフ構造の高精度な解析手法の確立
Project/Area Number |
21J10415
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
中嶋 一貴 東京工業大学, 情報理工学院, 特別研究員(DC2)
|
Project Period (FY) |
2021-04-28 – 2023-03-31
|
Keywords | ソーシャル・ネットワーク分析 / ソーシャル・ネットワーク / ランダム・ウォーク / 特徴量推定 |
Outline of Annual Research Achievements |
本研究の目的は,ランダム・ウォーク・サンプリングに基づくソーシャル・ネットワークの詳細かつ正確な解析手法を開発し,世界規模の人間同士の繋がりから成る社会構造のより深い理解を可能にすることである.令和3年度には,主に以下の2つの成果を挙げた. 第一に,ランダム・ウォークを用いてごく一部のグラフデータをサンプリングし,そのサンプルから元のソーシャル・ネットワークを復元する手法を開発した.提案手法は,ランダム・ウォークによりサンプリングした部分的なネットワークの構造と,ランダム・ウォークを用いて推定した局所的な構造的特性の両方を保存したネットワークを生成する.生成されたネットワークにより,解析対象の統計量の制約を無くし,元のネットワークの構造特性および視覚的表現を正確な推定を実現することを数値実験により示した.本研究成果は,ソーシャル・ネットワーク解析を扱う分野トップの査読有り国際会議 ICDE 2022 に採択された. 第二に,巨大なソーシャル・ネットワーク・サービスであるTwitter上のボットユーザの割合をランダム・ウォークを用いて推定する手法を開発した.ボットユーザは,Twitter上でコンテンツを自動生成するアカウントであり,マーケティングや政治的介入,フェイクニュースの拡散など,さまざまな目的で作成される.近年では,ボットユーザが個人の意見や行動に与える影響が注目されている.本研究では,そうした影響を明らかにするために,データ保有者でない第三者の研究者がTwitter上のボットユーザの割合を高精度に推定することを可能にした.本研究成果は,論文誌 IEEE Access に採択された.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画通り,ランダム・ウォークを用いて得られたごく少量のデータ・サンプル (具体的には10%以下) を用いて,元のソーシャル・ネットワークの局所的特徴量 (例: 次数分布,クラスタ係数) および大域的な構造的特徴量 (例: 最短距離分布) を正確に再現するネットワークの生成手法を提案した.さらに,提案手法を用いて,元のソーシャル・ネットワークの視覚的特徴を正確に再現できることもわかった.既存のネットワーク生成手法は,低い次数のノードから成る周辺構造を視覚的に再現できない,あるいは元のネットワークの部分的構造を視覚的に再現できない,という問題点があった.提案手法は,これら2つの問題を解決して,10%以下のデータ・サンプルから元のネットワークの視覚的特徴を正確に再現することができた.
|
Strategy for Future Research Activity |
提案手法の1つの課題は,生成時間の長さである.既存手法と比較して生成ネットワークの再現度は大幅に向上したが,数百万ノードを含む大規模なソーシャル・ネットワークではネットワーク生成に数時間を要する.今後は生成過程のアルゴリズムの効率化を目指し,正確かつ高速なネットワーク復元手法を目指していく.また,本研究で提案した手法を第三者が手軽に利用できるライブラリとして公開することを目指す.現在,ライブラリの公開準備を進めている.
|