研究課題/領域番号 |
15K16092
|
研究機関 | 東京工業高等専門学校 |
研究代表者 |
山下 晃弘 東京工業高等専門学校, 情報工学科, 助教 (80589838)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | 自然言語処理 / SNS / プライバシー保護 / 機械学習 / 位置情報 |
研究実績の概要 |
今年度は,昨年度までの研究成果及び開発してきたシステムをベースとして,SNS利用ユーザの感情分析,及びそのユーザがSNS上で発進した内容の特徴語分析と,そのユーザが活動領域とするエリアの地理的な分析について研究開発を行った.本研究ではターゲットとするSNSとしてTwitter上のデータを扱っているが,Twitter上のデータの内,地理情報(緯度経度情報)が明示されているものは約1%である.そこで,発信されているテキスト内容から,そのTweetがどこから発信されているのかを特定するアルゴリズムを開発し,ユーザのプロファイルデータとして推測するアルゴリズムについて検討を行った.具体的には,Tweetされたテキスト分について形態素解析エンジンを用いて単語に分割し,そこから位置情報に紐づくと考えられる単語を抽出した.これらの単語は「位置推定寄与単語」と定義し,地名,駅名のほか店舗名や施設名なども位置推定寄与単語とした.これらの単語について,OpenStreetMapに登録された様々な店舗名や施設名に照らし,位置推定寄与単語から緯度経度を推定するアルゴリズムを開発した.結果として,約60%程度の精度で位置情報を特定することに成功しており,本結果を用いることでユーザプロファイルのうちロケーションに関する分析が可能になることが確認された.現在は,今年度開発した分析アルゴリズムを,感情分析や特徴分析のエンジンと統合し,個人プロファイル推測エンジンとしてシステム化している最中である.このシステムを使用してSNS利用のリスク管理や炎上予防システムとしての有用性については,アンケート調査などにより翌年度実施予定である.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本申請研究は,SNS利用において発信された様々なデータから,個人プロファイルに関する情報の予測可能性について機械的に分析を行い,SNS利用におけるプライバシー漏えいや炎上等の様々なリスクを事前に予防する手段をユーザに提供するシステムを開発することが目的である.平成28年度までの研究において,SNS上で配信されたデータに基づいて,ユーザの感情分析やそのユーザに特徴的な単語についての分析を行い,他人がどの程度ユーザプロファイルを推定可能であるかを可視化するアルゴリズムの開発に取り組んできた.また平成28年度は特に位置情報に着目し,ユーザが発信したつぶやきがどの場所から発信されたものであるか,明示的に緯度経度(ジオタグ)を付加していなくても,そのテキスト文から推測するアルゴリズムの開発を行った.その中で位置推定を行うために利用可能な単語を「位置推定寄与単語」として定義し,OpenStreetMapで得られる様々な施設名や店舗名と照合することで緯度経度を特定するアルゴリズムを開発した.この手法を利用することで,一定の精度で推測可能であることを示すことができた.ユーザが発信する情報を統合することで,そのユーザが意図していないプロファイルまで他人が予測できてしまうという現象は,多く生じていると考えられる.平成29年度は本申請研究の最終年度として,ユーザの単発の発言だけではなく,一定の期間の発言を総合してプロファイリングするアルゴリズムを開発し,そのユーザに対してSNS上のデータから様々な情報が推測されるリスクを提示するシステムについて開発を行う予定である.
|
今後の研究の推進方策 |
これまで開発してきたアルゴリズムを統合し,SNS上のデータからどのような個人プロファイルが予測可能であるか,ユーザに提示するシステムを構築してその有用性を評価する.具体的には,そのユーザの発信した発言から予測される感情のデータや,年齢や性別などのデモグラフィック属性に関する予測値,大学や会社などの所属情報等,いくつかの属性について機械学習アルゴリズムを用いて予測した結果を提示し,SNS利用において第三者が予測可能であると考えられる情報について提示するシステムのプロトタイプを開発する.また,そのユーザが発信した情報がどこから発信されたものであるか,明示的に位置情報が付加されていなくても予測可能であることを示し,ユーザの行動範囲の推定結果を示すことで,警告する機能についても実装を試みる.最終的には,開発したプロトタイプシステムについて複数人のユーザに対して利用してもらい,アンケートなどの方法で有用性や実用性について評価を実施する.また申請者らが過去に開発した,炎上検出システムとの連動の可能性についても検討を行い,SNS利用におけるリスク管理,モニタリングシステムとして実現する目途をつける.
|
次年度使用額が生じた理由 |
研究成果を報告するための学会旅費について,別の予算にて計上できたため,26,290円の次年度使用額が生じているが,おおむね予定通りの支出であったと考えている.
|
次年度使用額の使用計画 |
平成29年度は研究計画の最終年度となるため,学会発表等を積極的に行う予定である.そのため,この次年度使用額についても旅費等の予算として使用する予定である.
|