• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

SNS解析のための日本語文体論の構築

研究課題

研究課題/領域番号 22K12285
研究機関国立情報学研究所

研究代表者

須田 永遠  国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40933411)

研究分担者 栗田 和宏  名古屋大学, 大学院情報学研究科, 助教 (40885266)
武富 有香  国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (60941101)
研究期間 (年度) 2022-04-01 – 2027-03-31
キーワードソーシャルメディア / 意味解釈 / 心的状態 / 言語的特徴 / 人々の関心の変化 / ナラティヴの類型 / テキストマイニング / 準最適解の列挙
研究実績の概要

本年度は、ソーシャルメディアの書き手の反応や心的状態の類型および言語的特徴に関する知見を獲得するため、実際に国内で影響力のある二つのソーシャルメディアを対象としてテキストデータを収集し、分析を行った。並行して本研究に必要なマイニング技術を下支えするアルゴリズムの開発も行い、これらの成果を国内外の会議や論文誌で発表した。詳細は以下の通りである。
(i) ワクチンに関する大規模なTwitterデータの分析:新型コロナウイルスワクチン接種期間中にTwitterで投稿された「ワクチン」の語を含む1億件以上の日本語の全ツイートデータを収集し、クラスタリング技術を用いてトピックごとに分類し、人手による意味解釈とアノテーションを施した上で時系列解析を行った。その結果、職域接種の開始を境に、人々の関心が社会的トピックから個人的事柄へと推移したことが明らかになった。
(ii) Yahoo!コメント上の#metooに対する中傷の類型化とアノテーション:#metoo運動以降、Yahoo!コメントに現れるようになった女性に対する誹謗中傷的ナラティヴを人手で読解・精査し、類型を作成、その類型にしたがってコメントにアノテーションを行うことで性暴力トピックに対する書き手の典型的な反応を析出し、反応の分布を明らかにした。その結果の一部は従来のミソジニーに関する人文学的研究の知見を定量的に証明するものとなった。
(iii) テキストマイニング技術の基礎となるアルゴリズムの開発:大量のテキストデータから書き手の心的状態と結びついた言語的特徴の累計を析出するには、まず限られたテキストを人手で解釈する必要があるが、その際にはある条件を満たす文を効率よくマイニングする情報学的な技術が必須である。こうした技術を下支えするアルゴリズム、本年度は特に条件をできるだけ満たす解(準最適解)を列挙するアルゴリズムの開発を行った。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画通り、ソーシャルメディア上で感情が表出されたテキストについて高度な意味解釈を通じた言語的特徴の析出を行い、成果として発表することができている。特に、新型コロナワクチンに関する大規模Twitterデータの分析は、国内の全ツイートを対象とした解析の試みであり、国際トップジャーナルに採択され、ニュースリリースも配信された。学術的価値だけでなく社会的にもインパクトの高い研究成果となった。テキストマイニングの基礎となるアルゴリズムの開発も順調に進んでいる。
本研究は分野横断的な研究であり、協働の方法論自体の構築も必須であるが、その意味で、本年度採用した情報学の技術と文学の読解技術とを組み合わせた研究スタイルが順調に成果を生んでいることは、次年度以降の研究を方向付けるものとなるだろう。

今後の研究の推進方策

新型コロナワクチン、性暴力被害者へのバッシングに加えて、より広いトピックについてのソーシャルメディアデータを対象に心的状態に結びついた言語的特徴の分析を進めていく。それとともに、複数のトピックに対して共通して現れる言語的特徴や、反応の類型の分析を進めることで、より一般的な文体論を構築するための知見を増やしていく。
またこの程公開された大規模言語モデルに基づく生成AIは、本研究で行うテキストへのアノテーションや意味解釈において補助的な役割を担い、研究をより一層加速させるためのツールとなることが期待される。有効な利活用の方法も含めて、研究を進めていきたい。

  • 研究成果

    (15件)

すべて 2023 2022 その他

すべて 国際共同研究 (1件) 雑誌論文 (8件) (うち国際共著 2件、 査読あり 6件、 オープンアクセス 1件) 学会発表 (6件) (うち国際学会 1件、 招待講演 2件)

  • [国際共同研究] ゲント大学(ベルギー)

    • 国名
      ベルギー
    • 外国機関名
      ゲント大学
  • [雑誌論文] A Framework to Design Approximation Algorithms for Finding Diverse Solutions in Combinatorial Problems2023

    • 著者名/発表者名
      Tesshu Hanaka, Masashi Kiyomi, Yasuaki Kobayashi, Yusuke Kobayashi, Kazuhiro Kurita, Yota Otachi
    • 雑誌名

      Proceedings of The 37th AAAI Conference on Artificial Intelligence (AAAI-23)

      巻: - ページ: -

    • 査読あり
  • [雑誌論文] Evolution of Public Opinion on COVID-19 Vaccination in Japan: Large-Scale Twitter Data Analysis2022

    • 著者名/発表者名
      Kobayashi Ryota、Takedomi Yuka、Nakayama Yuri、Suda Towa、Uno Takeaki、Hashimoto Takako、Toyoda Masashi、Yoshinaga Naoki、Kitsuregawa Masaru、Rocha Luis E C
    • 雑誌名

      Journal of Medical Internet Research

      巻: 24 ページ: e41928~e41928

    • DOI

      10.2196/41928

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022

    • 著者名/発表者名
      武富有香, 松田智裕, 須田永遠, 宇野毅明
    • 雑誌名

      人文科学とコンピュータシンポジウム論文集

      巻: 1 ページ: 213-220

    • 査読あり
  • [雑誌論文] 大規模Twitterデータを用いた新型コロナワクチン接種に関する世論変化の分析2022

    • 著者名/発表者名
      武富有香, 中山悠理, 須田永遠, 宇野毅明, 橋本隆子, 豊田正史, 吉永直樹, 喜連川優, Luis E C Rocha, 小林亮太
    • 雑誌名

      情報処理学会第85回全国大会発表予稿集

      巻: - ページ: 445-446

    • 国際共著
  • [雑誌論文] 複数テキストの利用による問いの広がりと深まり(批判的思考・創造的思考の育成を目指して)2022

    • 著者名/発表者名
      松下達彦, 藤永清乃, 須田永遠, 武富有香, 江頭由美, 柿山礼美, 片山智子, 行田悦子
    • 雑誌名

      日本リメディアル教育学会 第17回全国大会発表予稿集

      巻: - ページ: 26-29

  • [雑誌論文] Extracting Cliches: Typify Slanderous Expressions Against the Confessions in the #MeToo Movement2022

    • 著者名/発表者名
      Yuka Takedomi, Towa Suda, Kazuhiro Kurita, Ryota Kobayashi, Tomohiro Matsuda, Takeaki Uno
    • 雑誌名

      Digital Humanities Conference 2022 Conference Abstracts

      巻: - ページ: 695-696

    • 査読あり
  • [雑誌論文] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022

    • 著者名/発表者名
      宇野毅明, 武富有香, 小林亮太, 橋本隆子, 久保山哲二, 申吉浩
    • 雑誌名

      人文科学とコンピュータシンポジウム論文集

      巻: - ページ: -

    • 査読あり
  • [雑誌論文] Polynomial-Delay Enumeration of Large Maximal Matchings2022

    • 著者名/発表者名
      Yasuaki Kobayashi, Kazuhiro Kurita, Kunihiro Wasa
    • 雑誌名

      Proceedings of The 48th edition of the International Workshop on Graph-Theoretic Concepts in Computer Science (WG2022), Lecture Notes in Computer Science

      巻: 13453 ページ: -

    • 査読あり
  • [学会発表] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022

    • 著者名/発表者名
      武富有香, 松田智裕, 須田永遠, 宇野毅明
    • 学会等名
      人文科学とコンピュータシンポジウム
  • [学会発表] 複数テキストの利用による問いの広がりと深まり(批判的思考、創造的思考の育成を目指して)2022

    • 著者名/発表者名
      松下達彦, 藤永清乃, 須田永遠, 武富有香, 江頭由美, 柿山礼美, 片山智子, 行田悦子
    • 学会等名
      日本リメディアル教育学会第17回全国大会 日本語部会
    • 招待講演
  • [学会発表] 問いの循環による複数テキストの批判的統合:言語クラスにおける授業方法と教材の開発2022

    • 著者名/発表者名
      松下達彦, 藤永清乃, 江頭由美, 柿山礼美, 片山智子, 行田悦子, 須田永遠, 武富有香
    • 学会等名
      「未来を創ることばの教育をめざして、内容重視の批判的言語教育のその後」第2回シンポジウム
    • 国際学会
  • [学会発表] Extracting Cliches: Typify Slanderous Expressions Against the Confessions in the #MeToo Movement2022

    • 著者名/発表者名
      Yuka Takedomi, Towa Suda, Kazuhiro Kurita, Ryota Kobayashi, Tomohiro Matsuda, Takeaki Uno
    • 学会等名
      Digital Humanities Conference 2022
  • [学会発表] 思想史ネットワーク分析/SNS解析のための日本語文体論の試みについて2022

    • 著者名/発表者名
      須田永遠
    • 学会等名
      フランス現象学研究会 (科研費 基盤研究(C)「いわく言いがたいものの現象学:「フランス現象学」の生成と発展に関する研究」)
    • 招待講演
  • [学会発表] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022

    • 著者名/発表者名
      宇野毅明, 武富有香, 小林亮太, 橋本隆子, 久保山哲二, 申吉浩
    • 学会等名
      人文科学とコンピュータシンポジウム

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi