2015 Fiscal Year Annual Research Report
Project/Area Number |
25280113
|
Research Institution | Waseda University |
Principal Investigator |
山名 早人 早稲田大学, 理工学術院, 教授 (40230502)
|
Project Period (FY) |
2013-04-01 – 2017-03-31
|
Keywords | 著者推定 / インターネットの安全性 / SNS / Tweet / 信憑性 |
Outline of Annual Research Achievements |
インターネット上には様々な情報が氾濫し、その信憑性が社会問題化している。本研究は、「誰がその記事を書いたか」という著者推定を数十万人規模で行うことにより、将来的には、記事の著者を推測し、著者本人の信頼性に帰着させることを目指した。 今年度は、昨年度までに達成した10万人規模での著者推定(Twitterユーザを対象)の精度向上(既に約60%達成)を目指すと共に、高速化、応用拡大を目指した。具体的には、ユーザ間の繋がりを利用した著者属性推定を行った。次に、高速化を達成するため、昨年度提案した類似度計算に、前処理としてLSH(局所性鋭敏型ハッシュ)を用いる手法を提案した。最後に、アクティブ認証への応用検討を行った。 著者推定精度向上においては、著者自身の属性推定を著者間の繋がり(フォロー、フォロアーの関係、ダイレクトメッセージの関係)を用いて推定する手法を提案した。提案手法はオープンエンドな手法であり、ユーザ間の繋がりをグラフ表現(属性を表す単語の関連度を用いて重み付け)し、Personalized PageRankを適用した。800万人のデータを用いた評価実験では、MAP@30の評価指標で0.8を達成し、十分に精度ある属性推定が実現できることを確認した。 高速化においては、LSHにより事前に比較対象ユーザ数を減らす戦略を提案した。絞り込みにより、精度(P@1)を0.025(P@1の場合)落とすことを許せば、約2倍の高速化が可能であることを示した。 最後にアクティブ認証への応用を検討した。アクティブ認証はユーザとのインタラクション中に継続的な認証を行う手法である。Twitterを対象に、著者推定手法を応用した結果、評価指標ERR値(エラー率)0.127を達成できた。これは、機械学習を利用する手法よりもエラー率を低くできることを示しており、応用の可能性を示すことができた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初予定していた数十万人規模での著者推定を実現するだけでなく、著者の属性推定による精度向上を実現した。さらに、同提案手法の応用としてアクティブ認証について検討を行うことができた。
|
Strategy for Future Research Activity |
特に、同提案手法の有効性を、特にセキュリティ面への応用の観点から検討していく。
|
Causes of Carryover |
当初の研究目標は達成しているものの、研究成果発表の一部が次年度となったことにより、次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
研究成果発表(主にセキュリティ面への応用を予定)に使用する予定である。
|
Research Products
(8 results)