研究課題/領域番号 |
23700181
|
研究機関 | 青山学院大学 |
研究代表者 |
大原 剛三 青山学院大学, 理工学部, 准教授 (30294127)
|
研究期間 (年度) |
2011-04-28 – 2014-03-31
|
キーワード | 社会ネットワーク / コミュニティ抽出 / グラフマイニング / データマイニング / 情報工学 |
研究概要 |
本研究は,SNS(ソーシャルネットワーキングサービス)上で展開される大規模社会ネットワークを対象に,そこから部分的に重複し得る複数のコミュニティ(多重コミュニティ)を抽出し,その特徴を分析する技術を確立することを目的としている.具体的には,マイクロブログ上の表層的な利用者間相互参照関係ネットワークから実際に情報が伝わった時系列情報(情報伝搬系列)に基づき特定の興味を共有するコミュニティの一部を表す情報伝搬ネットワークを切り出し,それらを融合することで多重性を考慮しつつ個々のコミュニティを抽出し,コミュニティ内で伝搬した情報の内容に基づき各コミュニティを特徴づける一連の技術の確立を目指す.研究期間初年度である平成23年度は,情報伝搬系列・情報伝搬ネットワークの自動抽出のうち比較的容易に実現可能であるタグ情報を用いた手法の開発を中心に研究を進めた.具体的には,代表的なマイクロブログであるTwitterを対象とし,その中で特定のトピックに関する記事を投稿する場合に用いられるハッシュタグ,他人の投稿をそのまま転送形式で利用する場合に用いられる記号"RT"などのタグを手掛かりに,トピックごとに投稿記事の時系列リストである情報伝搬系列を抽出し,それらと相互参照関係ネットワークから情報伝搬ネットワークを抽出した.また,タグ情報の他に,投稿記事中のキーワードの共起関係を利用することより,抽出精度が向上することも確認した.一方,複数のグラフ構造から頻出する共通部分グラフを抽出するグラフマイニング手法を利用し,抽出した情報伝搬ネットワークを融合することで,共通する興味をもつ人物から構成されるコミュニティを抽出するシステムを試作した.これらは,日々,大量の記事が投稿される大規模社会ネットワークを効率よく分析する上で重要な基盤技術であり,次年度以降の本研究においても中心的な役割を果たすものである.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
初年度の研究計画において予定していたタグ情報を用いた情報伝搬系列・情報伝搬ネットワークの自動抽出法,および情報伝搬ネットワークの融合法の実現について,プロトタイプシステムの構築と,小規模データでの評価まで進んでおり,ほぼ予定通りに進行している.
|
今後の研究の推進方策 |
初年度は震災の影響で予算総額が秋まで確定しなかったこと,およびタイの洪水の影響で本研究には欠かせない大容量HDDの調達見通しが立たなくなったことから,評価データ蓄積用のストレージシステム導入を先送りした.そのため,次年度は早期に評価実験環境を整備し,初年度に開発した手法の大規模データによる評価を進めるとともに,当初の計画通り情報コンテンツを用いた情報伝搬系列抽出法の開発を進める.
|
次年度の研究費の使用計画 |
初年度に先送りしたストレージシステムを含めた評価実験環境(評価実験用計算機を含む)整備のために,前年度から繰り越した額を合わせて物品費として110万円程度の使用を予定し,データの収集,整理に伴う謝金も前年度の謝金未使用分と合わせた20万円程度の使用を予定している.成果発表・資料収集のための国内・国外旅費,および会議参加費に関しては,ほぼ当初計画通りの76万円程度を予定している.
|