• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Research-status Report

不変情報と変動情報の融合による俗語感性辞書の構築

Research Project

Project/Area Number 15K16077
Research InstitutionThe University of Tokushima

Principal Investigator

松本 和幸  徳島大学, 大学院理工学研究部, 助教 (90509754)

Project Period (FY) 2015-04-01 – 2019-03-31
Keywords俗語辞書 / 時系列分析 / 大規模コーパス / Twitter / ネット炎上
Outline of Annual Research Achievements

前年度に引き続き、辞書構築および知識ベースの構築を進めた。不変情報と変動情報の観点から、俗語と標準語を、コーパスから獲得した単語意味表現および表層特徴量に基づき分類する手法を、俗語の種別や、出現時期等を考慮して考案し、予備実験をおこなった。予備実験の結果、ある程度の分類性能が得られることを明らかにした。
現時点で、俗語を含んだ大規模ツイートコーパスの構築が部分的に完了しており、時間的な変動を分析するために必要なだけの分量が(約2年分)蓄積できている。このコーパスをもとに、辞書自動構築実験や分類アルゴリズムの評価、フィルタリング技術のプロトタイプ作成などを、次年度以降迅速に進めていくことが可能である。
2016年度は、俗語の変動分析手法に関する雑誌論文を1報、分散意味表現と感性的な類似性を考慮して俗語を標準語に変換するアルゴリズムについての雑誌論文を1報発表した。それに加え、俗語で表現された有害表現を、手作業で収集した有害表現辞書とその分散意味表現を用い、有害表現判別をおこない、フィルタリングするための技術を開発し、有害表現判定システムのデモ用プロトタイプシステムも構築した。この研究内容について、関連する分野の研究会において報告をおこなった。提案システムにより、Twitter上の炎上の防止に貢献することができ、社会的に問題となっている炎上現象のメカニズムの分析に貢献できると考える。
また、俗語の変動分析対象となるデータは、現在も収集中であり、俗語の意味的/感性的なアノテーションをおこない、ある程度大規模なコーパスとして構築することを考えている。既に、コーパスを分析するための枠組みをトピックモデリングおよび深層学習により実装し始めており、小規模なデータに対する分析結果が得られている。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度に構築を始めた辞書やコーパス、知識ベースの整備作業が大詰め段階となり、作成した言語資源をもとに、ある程度の成果を出せるようになった。成果として、雑誌論文3報の発表、国際会議発表3件をおこなった。当初の予定では、データ整理作業に多くの時間と労力がかかるとみられていたが、前年度に確立した整備作業の効率化方法により、少人数によるデータ整理作業の著しい進展がみられた。

Strategy for Future Research Activity

次年度以降は、新しい手法を取り入れることにより、より精度の高い俗語感性辞書の構築方法を検討し、必要ならばデータの整理作業を追加で進めていく。また、研究室の進学人数などの関係で、人的リソースが不足していたため、今後は共同研究者との連携をより一層深めることにより、他研究機関の人的リソースをうまく追加できるように進めていきたいと考えている。
さらに、成果発表の場を、人工知能・感性情報関連分野以外の学際的な分野や、言語学的な分野にも広げることで、より研究を深化させるための議論ができると考えている。それに加え、構築した言語資源を部分的に公開し、利用してもらうことで、その利用方法についても様々な見解を得るということも考えている。
また、日本語俗語という特殊な言語表現を対象としているため、適用範囲が狭く、国際的な理解を得ることが難しい側面もあるため、他言語への応用方法や、俗語の発生と衰退現象のメカニズムを応用した、非言語的な表現との時系列的な関連付け(画像や音声・音楽情報との多メディアとの融合)の方法についても模索していく予定である。

  • Research Products

    (8 results)

All 2017 2016

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 2 results,  Acknowledgement Compliant: 3 results) Presentation (5 results) (of which Int'l Joint Research: 4 results)

  • [Journal Article] 感性を考慮した日本語俗語の標準語変換2017

    • Author(s)
      松本和幸、土屋誠司、芋野美紗子、吉田稔、北研二
    • Journal Title

      人工知能学会論文誌

      Volume: 32 Pages: 1-12

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Refinement by Filtering Translation Candidates and Similarity Based Approach to Expand Emotion Tagged Corpus2017

    • Author(s)
      Kazuyuki Matsumoto, Fuji Ren, Minoru Yoshida and Kenji Kita
    • Journal Title

      Knowledge Discovery, Knowledge Engineering and Knowledge Management. Communications in Computer and Information Science (CCIS)

      Volume: 631 Pages: 260-280

    • DOI

      10.1007/978-3-319-52758-1_15

    • Peer Reviewed / Acknowledgement Compliant
  • [Journal Article] Slang Analysis Based on Variant Information Extraction Focusing on the Time Series Topics2016

    • Author(s)
      Kazuyuki Matsumoto, Minoru Yoshida, Seiji Tsuchiya, Kenji Kita and Fuji Ren
    • Journal Title

      International Journal of Advanced Intelligence

      Volume: 8 Pages: 84-98

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] 分散表現を用いた有害表現判別に基づく炎上予測2017

    • Author(s)
      三宅 剛史, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会(第15回)
    • Place of Presentation
      東京大学(東京都目黒区)
    • Year and Date
      2017-03-04 – 2017-03-04
  • [Presentation] Ego-state Estimation from Short Texts Based on Sentence Distributed Representation2016

    • Author(s)
      Kazuyuki Matsumoto, Tanaka Satoshi, Minoru Yoshida, Kenji Kita and Fuji Ren
    • Organizer
      The 11th International Conference on Natural Language Processing and Knowledge Engineering (NLP-KE'16)
    • Place of Presentation
      沖縄市町村自治会館(沖縄県沖縄市)
    • Year and Date
      2016-12-14 – 2016-12-14
    • Int'l Joint Research
  • [Presentation] Effect of Users Attribute on Emotion Estimation from Twitter2016

    • Author(s)
      Kazuyuki Matsumoto, Minoru Yoshida, Kenji Kita, Yunong Wu and Iwasa Fumihiro
    • Organizer
      the 2nd IEEE International Conference on Computer and Communications
    • Place of Presentation
      Chengdu, China
    • Year and Date
      2016-10-16 – 2016-10-16
    • Int'l Joint Research
  • [Presentation] Judgment of Slang Based on Character Feature and Feature Expression Based on Slangs Context Feature2016

    • Author(s)
      Kazuyuki Matsumoto, Seiji Tsuchiya, Minoru Yoshida and Kenji Kita
    • Organizer
      International Conference on Soft Computing in Data Science 2016
    • Place of Presentation
      Kuala Lumpur, Malaysia
    • Year and Date
      2016-09-22 – 2016-09-22
    • Int'l Joint Research
  • [Presentation] 情報推薦のための Twitter ユーザの性格分析手法2016

    • Author(s)
      田中 聡, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      人工知能学会全国大会2016
    • Place of Presentation
      北九州国際会議場(福岡県北九州市)
    • Year and Date
      2016-06-08 – 2016-06-08
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi