2017 Fiscal Year Research-status Report
Project/Area Number |
16K16112
|
Research Institution | Nagoya University |
Principal Investigator |
笹原 和俊 名古屋大学, 情報学研究科, 講師 (60415172)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 行動文法 / 時系列 / ネットワーク / ソーシャルデータ |
Outline of Annual Research Achievements |
昨年度の基礎研究の成果を踏まえて、多層的かつ時系列的な行動データを分析する手法を実装し、今年度はオンラインの行動データに適用して、その精度や改善点を検討した。取り組んだ実験は、SNSの時系列データからの個人属性予測とソーシャルボットの検出である。SNSのTwitterのデータを用いて実験を行ったところ、どちらの課題においても、提案手法を既存の手法よりもよい精度が得られることがわかった。具体的には、Twitterの時系列からの個人属性の予測課題では、ツイートをword2vecでベクトル化し、階層的ニューラネットワークと既存の機械学習手法との個人属性(性別、年齢層(デジタルネイティブとデジタル移民)、職業10種)の予測精度の比較をおこなった。この成果については、国際会議IEEE Big Data 2017と第2回計算社会科学ワークショップで発表した。さらに、Twitterの時系列からソーシャルボットの検出課題を行ったところ、ランダムフォレストモデルをベースとする提案手法は、やはり高い予測精度が得られることがわかった。この成果についても、第2回計算社会科学ワークショップで発表した。一方、パラメータの設定にまだ改善の余地があることもわかったため、今後は、さらに多様な実データを用いた実験とパラメータに関する研究を進める必要がある。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
Twitter上で著名なユーザー120名のデータを収集し、実装した階層的ニューラネットワークと既存の機械学習手法との個人属性(性別、年齢層、職業)の予測精度の比較をおこなった。その結果、どの予測課題においても、提案手法はサポートベクトルマシンと同程度かそれ以上の予測精度が得られることが明らかになった。さらに、ランダムフォレストモデルを改変した手法で、ソーシャルボットの検出課題を行ったところ、やはり提案手法は高い予測精度が得られることがわかった。
|
Strategy for Future Research Activity |
上記2つの課題において、提案手法を既存手法よりも良い精度が得られることがわかったものの、パラメータの設定の最適化には検討の余地があることも明らかになった。今後は、実データによる検証実験を増やしつつ、最適なパラメータの設定に関する研究も行う。
|
Causes of Carryover |
論文出版のための費用として、次年度に繰り越したため若干の違いが生じた。
|
Research Products
(5 results)