• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Final Research Report

Construction of a slang sensitivity dictionary by fusion of invariant information and variable information

Research Project

  • PDF
Project/Area Number 15K16077
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeMulti-year Fund
Research Field Kansei informatics
Research InstitutionThe University of Tokushima

Principal Investigator

MATSUMOTO Kazuyuki  徳島大学, 大学院社会産業理工学研究部(理工学域), 助教 (90509754)

Project Period (FY) 2015-04-01 – 2019-03-31
Keywords日本語俗語 / トピック分析 / 感性分析 / ソーシャルメディア / コーパス / 標準語変換 / 時系列分析 / 自然言語処理
Outline of Final Research Achievements

In this study, we collected Japanese slang words currently used in Japan from the dictionaries etc., and constructed a large-scale slang corpus by collecting examples on microblogs such as Twitter. By using this corpus, we created a topic model from the peripheral context of slang words, etc., and a slang sensitivity dictionary automatically by analyzing changes in topics and sensibility (negative / positive etc.) of usage of slang words. In addition, with regard to words called Internet slang, we conducted a sensitivity evaluation questionnaire for subjects in their 20s targeting multiple sensitivity axes. Based on this result, we proposed a method converting slang into standard word that can reflect intention more accurately than in the case of considering only semantic elements by considering sensuous elements.

Free Research Field

感性情報処理

Academic Significance and Societal Importance of the Research Achievements

本研究成果により、従来は形態素解析の辞書など自然言語処理ツールでは解析対象とされにくかった俗語に対して感性と意味の両方の側面から分析し、標準語との相互変換が可能になった。この手法を用いることにより、たとえば、インターネット上の多種多様で膨大な意見集合から自動要約技術などにより意見を集約する際に、俗語を用いた発言の意図を意味と感性の両方を考慮して適切に解釈することが可能となる。また、俗語は、時間経過とともに新たな意味が付与されるため、本研究成果であるSNS上の発言からトピック変化や意味、感性の変化を分析する手法により、俗語辞書を構築すれば国語資料としても有用となることが期待される。

URL: 

Published: 2020-03-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi