2017 Fiscal Year Annual Research Report
A Study of Detecting "bad mouth" Comments in Social Media based on Actual Usage of Language Expressions
Project/Area Number |
15K20884
|
Research Institution | University of Tsukuba |
Principal Investigator |
乾 孝司 筑波大学, システム情報系, 准教授 (60397031)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 有害情報 / 誹謗中傷 / ソーシャルメディア / 自然言語処理 / 固有表現認識 / エンティティリンキング |
Outline of Annual Research Achievements |
本研究課題は,ソーシャルメディア上に流れる誹謗中傷行為の高精度な自動検出技術を開発することを目的とする. 平成27年度および平成28年度は以下の項目を実施した:(1)およそ5,000投稿のテキストデータを対象にして,誹謗中傷行為に使用される言語表現の使用実態調査を実施した.(2) 使用実態調査の結果を踏まえた誹謗中傷検出モデルを開発し,提案手法の有効性を示した.(3) 被害者表現の自動認識のための難易度調査を実施した.また,これらの実施を通して,被害者の情報が誹謗中傷行為の検出に影響を与えることを明らかにした. 以上の成果のうち,平成29年度は,開発が未着手であった誹謗中傷行為を受けている被害者情報を自動取得する手法を主に検討した.具体的には,投稿テキストから(組織を含む)人物をあらわす表現を自動認識する手法および,人物表現と実世界の人物エンティティとの対応付け手法を開発した. 投稿テキスト中の人物表現を自動認識する手法については,条件付確率場に基づく既存手法に対して,新たに知識ベースに基づく素性および文節情報に基づく素性を取り込む手法を提案し,人物表現認識性能の向上を達成した.また,前年度に開発した難易度指標を用いた分析の結果,知識ベースに基づく素性はすべての難易度の事例群に対して有効であることがわかった.文節情報に基づく素性では,難易度の高い事例群に対して文節主辞の情報に加えて格情報を考慮することが重要であることがわかった.人物表現と実世界の人物との対応付け手法については,固有表現クラス情報に基づくフィルタリングを導入することで不要なエンティティ候補を削減し,これによって人物表現に関する実世界の人物エンティティとの対応付け正解率が向上することを示した. 以上から,本研究課題は研究期間全体を通して当初研究目的で述べた項目について概ね達成できたと言える.
|
Research Products
(2 results)