• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

数値および専門性と話題性に着目したSNSからの科学的知識抽出に関する研究

Research Project

Project/Area Number 21K12141
Research InstitutionThe University of Tokushima

Principal Investigator

吉田 稔  徳島大学, 大学院社会産業理工学研究部(理工学域), 講師 (40361688)

Co-Investigator(Kenkyū-buntansha) 北 研二  徳島大学, 大学院社会産業理工学研究部(理工学域), 教授 (10243734)
松本 和幸  徳島大学, 大学院社会産業理工学研究部(理工学域), 准教授 (90509754)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords数値情報解析 / SNS分析 / 画像とテキストの関連分析
Outline of Annual Research Achievements

本年度は、主に、数値の取り扱いに関する研究を進めた。特に、数値的知識を単語分散表現に埋め込むための手法として、数値分布をNMFにより分解して、少ない次元のベクトルに変換する手法を開発し、その単語類似度計算への応用を試みた。同様に、単語類似度計算を改善する手法として、数値の前処理を適切に行った場合と行わない場合の両方で単語分散表現の学習を行い、前処理によって類似度計算が改善する傾向を確認した。
SNSの分析では、画像特徴量を利用したバズツイートの予測という題材で、テキストと画像との統合的解析の研究を行った。また、顔文字の感情抽出を題材として、文字を画像化して、BERTとCNNを併用した深層学習により分類する手法について研究を行った。
数値が重要となるテーマとして、生活習慣病とSNSテキストの関係についても研究を行った。闘病に関するブログを分析し、キーワードの抽出・分類を行うための研究や、SNSから、生活習慣病のリスクを予測するための研究を行った。
また、表形式とテキストの関係に関する研究として、インターネット通販サイトの表形式データをもとに、簡潔な商品紹介文を生成するための研究を行った。
このほか、分散表現の獲得において重要な手法である事前学習モデルBERTに関連して研究を進めた。BERTの内部構造解析に関する調査を進めたほか、BERTを用いた数値の分類や、攻撃的文書の分類に関する研究を行った。このほか、感情表現を利用した要約文の生成を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

初年度は、数値を利用した分散表現の獲得や、事前学習モデルBERTを利用した数値分類の試みやBERT内部構造の調査等、分散表現に関する基礎技術の構築を行ったほか、数値とテキストの関係および、画像・表形式とテキストの関係に関して、基礎的な研究を行った。事前学習モデルの利用や、テキストと他のモダリティの関連の解析は、本研究提案において核心となるテーマである。
今後は、これら基礎技術をさらに発展させつつ、学術的情報の解析やSNS分析といった、本研究が最終的に対象とするデータ分析への活用を進めていく。

Strategy for Future Research Activity

BERTの内部構造解析、数値を適切に考慮した分散表現の獲得について、引き続き研究を進めていく。また、BERTを利用した数値の分類に関しても、さらに研究を進めていく。また、前年度開発したNMFによる数値分布の表現ベクトルを利用し、数値の意味を言語と統合的に扱う手法について研究を進める。
投稿者の専門性や文書構造を利用した単語・数値重要度の測定については、まだ研究が進んでいないため、R4年度以降は、この部分の研究を進展させていく。

Causes of Carryover

感染拡大防止のため、海外への渡航制限や、国内での移動が推奨されない環境があり、また、多くの学会がオンライン開催となったため、出張に関する費用が不要となった。R4以降は、現地開催の会議が増加することが予想されるため、会議参加のための出張旅費として使用する予定である。

  • Research Products

    (17 results)

All 2022 2021

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (13 results) (of which Int'l Joint Research: 6 results) Book (1 results)

  • [Journal Article] Emotion Estimation Method Based on Emoticon Image Features and Distributed Representations of Sentences2022

    • Author(s)
      Akira Fujisawa, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita
    • Journal Title

      Applied Sciences

      Volume: 12-3 Pages: 1256-1271

    • DOI

      10.3390/app12031256

    • Peer Reviewed / Open Access
  • [Journal Article] Relationship Between Personality Patterns and Harmfulness: Analysis and Prediction Based on Sentence Embedding2022

    • Author(s)
      Kazuyuki Matsumoto, Ryota Kishima, Seiji Tsuchiya, Tomoki Hirobayashi, Minoru Yoshida and Kenji Kita
    • Journal Title

      International Journal of Information Technology and Web Engineering (IJITWE)

      Volume: 17-1 Pages: 1-24

    • DOI

      10.4018/IJITWE.298654

    • Peer Reviewed / Open Access
  • [Journal Article] Buzz Tweet Classification Based on Text and Image Features of Tweets Using Multi-Task Learning2021

    • Author(s)
      Reishi Amitani, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita
    • Journal Title

      Applied Sciences

      Volume: 11-22 Pages: 10567-10581

    • DOI

      10.3390/app112210567

    • Peer Reviewed / Open Access
  • [Presentation] 多変量解析と機械学習を用いたカラーイメージスケールの再構成に関する一検討2022

    • Author(s)
      鳥取 賢人, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      第17回日本感性工学会春季大会
  • [Presentation] SNS の投稿内容に基づく生活習慣病発症リスクの分析2022

    • Author(s)
      田渕 尚道, 松本 和幸, 吉田 稔, 西村 良太, 北 研二
    • Organizer
      言語処理学会 第28回年次大会 発表論文集
  • [Presentation] 登場人物の感情表現文の抽出による物語のハイライト生成2022

    • Author(s)
      三木 建哉, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      電子情報通信学会2022年総合大会 情報・システムソサイエティ特別企画 ジュニア&学生ポスターセッション予稿集
  • [Presentation] BERTを用いたSNS上における攻撃的文章訂正システム2022

    • Author(s)
      吉田 基信, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      情報処理学会第84回全国大会講演論文集
  • [Presentation] Prediction of Number of Likes and Retweets based on the Features of Tweet Text and Images2021

    • Author(s)
      Reishi Amitani, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita
    • Organizer
      Proceedings of 2021 5th International Conference on Natural Language Processing and Information Retrieval
    • Int'l Joint Research
  • [Presentation] Construction of MBTI Personality Estimation Model Considering Emotional Information2021

    • Author(s)
      Ryota Kishima, Kazuyuki Matsumoto, Minoru Yoshida and Kenji Kita
    • Organizer
      Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC35)
    • Int'l Joint Research
  • [Presentation] Construction of Emotional Similarity Word Embedding Model for Sentiment Analysis2021

    • Author(s)
      Kazuyuki Matsumoto, Matsunaga Takumi, Minoru Yoshida and Kenji Kita
    • Organizer
      20th Mexican International Conference on Artificial Intelligence (MICAI2021)
    • Int'l Joint Research
  • [Presentation] Topic Segmentation for Interview Dialogue System2021

    • Author(s)
      Taiga Kirihara, Kazuyuki Matsumoto, Manabu Sasayama, Minoru Yoshida and Kenji Kita
    • Organizer
      Proceedings of 2021 5th International Conference on Natural Language Processing and Information Retrieval
    • Int'l Joint Research
  • [Presentation] The Relationship between Personality Patterns and Harmfulness: Analysis and Prediction based on Sentence Embedding2021

    • Author(s)
      Kishima Ryota, Kazuyuki Matsumoto, Hirobayashi Tomoki, Seiji Tsuchiya, Minoru Yoshida and Kenji Kita
    • Organizer
      3rd Technological Competency as Caring in the Health Sciences 2021
    • Int'l Joint Research
  • [Presentation] Lifestyle Analysis via a Corpus of Disease-Fighting Weblogs2021

    • Author(s)
      Kazuyuki Matsumoto, Ryu Mopuaa, Minoru Yoshida and Kenji Kita
    • Organizer
      Proceedings of 2021 IEEE 2nd International Conference on Pattern Recognition and Machine Learning (PRML 2021)
    • Int'l Joint Research
  • [Presentation] 投稿文および画像といいね数との関係に基づく流行要因分析2021

    • Author(s)
      網谷 嶺志, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      HCG シンポジウム2021
  • [Presentation] 闘病ブログコーパスからの生活習慣の抽出2021

    • Author(s)
      宮下 翼, 吉田 稔, 松本 和幸, 西村 良太, 北 研二
    • Organizer
      令和3年度 電気・電子・情報関係学会 四国支部連合大会 講演論文集
  • [Presentation] 感情分類を用いた単語分散表現からの感性情報抽出2021

    • Author(s)
      松永 拓巳, 松本 和幸, 吉田 稔, 北 研二
    • Organizer
      第20回情報科学技術フォーラム(FIT2021)講演論文集
  • [Book] Information Systems (Section 1: Mining Numbers in Text: A Survey)2021

    • Author(s)
      Minoru Yoshida and Kenji Kita
    • Total Pages
      140
    • Publisher
      IntechOpen
    • ISBN
      978-1-83962-360-8

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi