2017 Fiscal Year Research-status Report
Project/Area Number |
15K16077
|
Research Institution | The University of Tokushima |
Principal Investigator |
松本 和幸 徳島大学, 大学院社会産業理工学研究部(理工学域), 助教 (90509754)
|
Project Period (FY) |
2015-04-01 – 2019-03-31
|
Keywords | 俗語辞書 / ソーシャルメディア / 大規模コーパス / Twitter / ネット炎上 / 感性解析 / 分散表現 |
Outline of Annual Research Achievements |
本年度は,俗語感性辞書の拡張のため,引き続き俗語を含むツイート文収集をおこない,収集したツイート文を用いた分析をおこなった.未知表現への対応をおこなうため,単語分散表現および文字分散表現を用いて,俗語の感性とそれらの特徴量との対応関係を学習させることで,新たに出現した未知俗語に対しての感性推定をおこなう仕組みを提案した.また,俗語のなかで,炎上の原因となるような有害表現についても分析をおこなった.主に,いじめツイートや,匿名掲示板上に出現するような有害表現を人手により収集し,それらをカテゴリ別に分けたうえで,ツイートコーパスをもとに学習した単語分散表現による語彙の自動拡張をおこなった.この結果,有害表現を約900語彙までに拡張することができ,有害表現辞書を作成できた.この有害表現辞書と,一般表現の語彙リストを用いて,単語分散表現を素性としてサポートベクターマシンなどの機械学習手法による有害度判定器を構築した.この有害度判定器により,文中の有害表現検出および,文の有害度を計算するプロトタイプシステムを構築した.また,俗語の感性辞書および俗語感情コーパスを応用した言語からの感情推定モデルを構築し,未知表現に頑健な感情推定手法を提案し,俗語表現が多用されるソーシャルメディアTwitter上の投稿を感情解析することで,Twitterユーザの本人のタイムラインおよびフォローしているユーザのタイムラインを取得してユーザの興味を引く投稿内容を分析・推薦するプロトタイプシステム開発に着手した.現在のところ,性格分析・顔文字/絵文字解析・ハッシュタグ推定の各種分析モデルの統合および調整をおこなっている.次年度は開発したモデルおよびシステムの評価に着手する予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初予定していた俗語の時系列解析と辞書構築は前年度にある程度開発が完了していたため,応用となる炎上分析システムや情報推薦システムのプロトタイプ開発に取り組めた.一方で,俗語辞書の更新について,俗語をコーパス中から高精度に自動検出する手法がまだ固まっていないため,最終年度は,俗語辞書更新のための手法開発を中心に取り組む予定である.
|
Strategy for Future Research Activity |
研究目的である俗語感性辞書の構築のために,分析対象をソーシャルメディアとして,様々な応用の観点から研究手法の開発を進めてきた.今後は,俗語検出の自動化手法を高度化するとともに,応用システムの開発および評価,実応用に向けた人手による辞書の洗練などをおこなうことで,それらの手法の確立に向けて研究を進めていく予定である.
|
Research Products
(15 results)