• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

Web情報を対象とした数十万人規模での著者推定

Research Project

Project/Area Number 25280113
Research InstitutionWaseda University

Principal Investigator

山名 早人  早稲田大学, 理工学術院, 教授 (40230502)

Project Period (FY) 2013-04-01 – 2017-03-31
Keywords著者推定 / インターネットの安全性 / SNS / Tweet / 信憑性
Outline of Annual Research Achievements

インターネット上には様々な情報が氾濫し、その信憑性が社会問題化している。本研究は、「誰がその記事を書いたか」という著者推定を数十万人規模で行うことにより、将来的には、記事の著者を推測し、著者本人の信頼性に帰着させることを目指した。
今年度は、昨年度までに達成した10万人規模での著者推定(Twitterユーザを対象)の精度向上(既に約60%達成)を目指すと共に、高速化、応用拡大を目指した。具体的には、ユーザ間の繋がりを利用した著者属性推定を行った。次に、高速化を達成するため、昨年度提案した類似度計算に、前処理としてLSH(局所性鋭敏型ハッシュ)を用いる手法を提案した。最後に、アクティブ認証への応用検討を行った。
著者推定精度向上においては、著者自身の属性推定を著者間の繋がり(フォロー、フォロアーの関係、ダイレクトメッセージの関係)を用いて推定する手法を提案した。提案手法はオープンエンドな手法であり、ユーザ間の繋がりをグラフ表現(属性を表す単語の関連度を用いて重み付け)し、Personalized PageRankを適用した。800万人のデータを用いた評価実験では、MAP@30の評価指標で0.8を達成し、十分に精度ある属性推定が実現できることを確認した。
高速化においては、LSHにより事前に比較対象ユーザ数を減らす戦略を提案した。絞り込みにより、精度(P@1)を0.025(P@1の場合)落とすことを許せば、約2倍の高速化が可能であることを示した。
最後にアクティブ認証への応用を検討した。アクティブ認証はユーザとのインタラクション中に継続的な認証を行う手法である。Twitterを対象に、著者推定手法を応用した結果、評価指標ERR値(エラー率)0.127を達成できた。これは、機械学習を利用する手法よりもエラー率を低くできることを示しており、応用の可能性を示すことができた。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

当初予定していた数十万人規模での著者推定を実現するだけでなく、著者の属性推定による精度向上を実現した。さらに、同提案手法の応用としてアクティブ認証について検討を行うことができた。

Strategy for Future Research Activity

特に、同提案手法の有効性を、特にセキュリティ面への応用の観点から検討していく。

Causes of Carryover

当初の研究目標は達成しているものの、研究成果発表の一部が次年度となったことにより、次年度使用額が生じた。

Expenditure Plan for Carryover Budget

研究成果発表(主にセキュリティ面への応用を予定)に使用する予定である。

  • Research Products

    (8 results)

All 2016 2015

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Acknowledgement Compliant: 2 results) Presentation (5 results)

  • [Journal Article] What is your Mother Tongue?: Improving Chinese Native Language Identification by Cleaning Noisy Data and Adopting BM252016

    • Author(s)
      Lan Wang, Masahiro Tanaka, Hayato Yamana
    • Journal Title

      Proc. of IEEE Int’l Conf. on Big Data Analysis

      Volume: 1 Pages: 1 - 5

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Predicting Various Types of User Attributes in Twitter by Using Personalized PageRank2015

    • Author(s)
      Kazuya Uesato, Hiroki Asai, Hayato Yamana
    • Journal Title

      Proc. of IEEE Int'l Conf. on BigData 2015

      Volume: 1 Pages: 2825 - 2827

    • DOI

      10.1109/BigData.2015.7364090

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] ビッグデータ関連プログラム-米国とEUにおける動向-2015

    • Author(s)
      山名早人
    • Journal Title

      情報処理学会誌

      Volume: 56 Pages: 962 - 967

    • Peer Reviewed
  • [Presentation] Personalized PageRankを利用した網羅的Twitterユーザ属性推定2016

    • Author(s)
      上里和也, 浅井洋樹, 山名早人
    • Organizer
      第8回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ヒルトン福岡シーフォーク
    • Year and Date
      2016-02-29 – 2016-03-02
  • [Presentation] Comparison of Community Detection Methods for Facebook Ego Network2016

    • Author(s)
      何 奕萱,上里 和也,山名 早人
    • Organizer
      第8回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ヒルトン福岡シーフォーク
    • Year and Date
      2016-02-29 – 2016-03-02
  • [Presentation] Twitterアクティブ認証精度向上のための文字N-gram IDFの提案2016

    • Author(s)
      石山雄大, 韓 正圭, 山名早人
    • Organizer
      第8回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ヒルトン福岡シーフォーク
    • Year and Date
      2016-02-29 – 2016-03-02
  • [Presentation] Locality-Sensitive Hashingを用いた大規模な著者推定の高速化2016

    • Author(s)
      田中 博己,石山 雄大,上里 和也, 山名早人
    • Organizer
      第8回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ヒルトン福岡シーフォーク
    • Year and Date
      2016-02-29 – 2016-03-02
  • [Presentation] Robust Chinese Native Language Identification with skip-gram2016

    • Author(s)
      Wang Lan,Yamana Hayato
    • Organizer
      第8回データ工学と情報マネジメントに関するフォーラム
    • Place of Presentation
      ヒルトン福岡シーフォーク
    • Year and Date
      2016-02-29 – 2016-03-02

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi