Foundation of Japanese stylistics for social media analysis

Research Project

Project/Area Number	22K12285
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 62020:Web informatics and service informatics-related
Research Institution	National Institute of Informatics
Principal Investigator	須田永遠国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40933411)
Co-Investigator(Kenkyū-buntansha)	栗田和宏名古屋大学, 情報学研究科, 助教 (40885266) 武富有香国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (60941101)
Project Period (FY)	2022-04-01 – 2027-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000) Fiscal Year 2026: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000) Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2024: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2023: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000) Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Keywords	ソーシャルメディア / 異分野融合 / ナラティブ / 列挙アルゴリズム / 意味解釈 / 心的状態 / 言語的特徴 / 人々の関心の変化 / ナラティヴの類型 / テキストマイニング / 準最適解の列挙 / SNS / 文体論 / ナラティヴ
Outline of Research at the Start	ソーシャルメディア上のテキストを解析するための日本語文体論を構築することを目指して、これまでSNS解析や自然言語処理で捉えることが難しいとされてきた意図や心理の問題に、文学研究が扱うような書き手の文章的特徴からアプローチを行う。具体的には人間の感情が表出していると思われるテキストサンプルをSNS上で収集し、発話されたコンテキストに着目しながらトピックごとに共通する言語的特徴を割り出す。従来の文体論の知見をSNS解析に応用可能なものとすることを念頭に、情報学と文学の研究者が協働して遂行する。
Outline of Annual Research Achievements	昨年度に引き続き、書き手の反応や心的状態の類型と言語的特徴を探るため、影響力のある二つのソーシャルメディアを対象として分析を行い、並行して解析に必要なマイニング技術を下支えするアルゴリズムの開発を行った。これらの成果は国内学会や研究会等で発表を行った。また、本プロジェクトを通じて得られた分野融合研究の知見に関する記事を執筆し、学会誌に寄稿した。 (i) Yahoo!コメントやTwitterの研究成果を国内学会・研究会で発表：昨年度から継続して行っているYahoo!コメント上に現れる女性への誹謗中傷の類型に関する研究成果を、情報学・アルゴリズム分野の研究者が集まる研究会にて発表した。同じく昨年から継続する新型コロナワクチンに関する大規模なツイートデータ分析について、人工知能学会全国大会で発表を行った。どちらにおいても解析の手法やデザイン、今後の方向性について有益なコメントを得ることができた。 (ii)大規模Twitterデータの分析：新型コロナウイルスワクチン接種期間中にTwitterで投稿された「ワクチン」の語を含む１億件以上の日本語の全ツイートデータを収集し、クラスタリングによって得られた各トピックの10か月間の詳細な内容について、人手での読解と単語の頻度分析に基づいた仮説の構築とその検証を行った。この成果はすでに論文誌に投稿し、現在査読中である。 (iii)異分野融合研究に関する記事を執筆：情報学と人文学との異分野融合による研究の意義と方法論、活動の実際について情報処理学会の学会誌『情報処理』に記事を寄稿した。 (iv)グラフデータマイニングの基盤技術となる、部分グラフ列挙の効率良いアルゴリズムについての研究：この研究を通じて、実用的であろう解のみを列挙するアルゴリズムを開発し、実用的に用いられているアルゴリズムの理論的な改善が不可能であることを明らかにした。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 昨年度同様、ソーシャルメディアのテキストについて高度な意味解釈を通じた分析による研究成果を発表することができている。また、本研究は分野横断的な研究であるため、情報学の技術と文学の読解技術とを組み合わせた方法論それ自体の構築も必要であるが、本年度は外部の研究者とのディスカッションや異分野融合に関する記事執筆などを通じて、方法論を明確化できつつある。
Strategy for Future Research Activity	同様の方法論を用いて、より広いトピックのソーシャルメディアデータを対象に分析を進めていく。また大規模言語モデルに基づく生成AIを用いることで、一定程度の意味理解をともなうアノテーションを自動化できることがわかりつつある。したがって具体的なプロンプトエンジニアリング含め、解析への有効な活用方法を模索していくことも急務となる。

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(23 results)

All 2024 2023 2022 Other

All Int'l Joint Research (1 results) Journal Article (14 results) (of which Int'l Joint Research: 3 results, Open Access: 6 results, Peer Reviewed: 7 results) Presentation (8 results) (of which Int'l Joint Research: 1 results, Invited: 2 results)

[Int'l Joint Research] ゲント大学(ベルギー)
- Related Report
  2022 Research-status Report
[Journal Article] 直観から遠く離れて──フランス文学研究者から見たアルゴリズム研究2024
- Author(s)
  須田永遠
- Journal Title
  
  情報処理
  
  Volume: 65(2) Pages: 94-100
- Related Report
  2023 Research-status Report
- Open Access
[Journal Article] On the hardness of inclusion-wise minimal separators enumeration2024
- Author(s)
  Brosse Caroline、Defrain Oscar、Kurita Kazuhiro、Limouzy Vincent、Uno Takeaki、Wasa Kunihiro
- Journal Title
  
  Information Processing Letters
  
  Volume: 185 Pages: 106469-106469
- DOI
  10.1016/j.ipl.2023.106469
- Related Report
  2023 Research-status Report
- Peer Reviewed / Int'l Joint Research
[Journal Article] 研究者のパラダイスかと思いきや──異分野融合の現場からラボ長と研究員の対話2023
- Author(s)
  宇野毅明, 武富有香
- Journal Title
  
  情報処理
  
  Volume: 64(11) Pages: 608-614
- Related Report
  2023 Research-status Report
- Open Access
[Journal Article] 何が分からないのか分からないので議論する──情報学の新しい問題カタログづくりの実際2023
- Author(s)
  武富有香, 松田智裕
- Journal Title
  
  情報処理
  
  Volume: 64(9) Pages: 484-489
- Related Report
  2023 Research-status Report
- Open Access
[Journal Article] Evolution of Public Opinion on COVID-19 Vaccination in Japan2023
- Author(s)
  武富有香, 中山悠理, 須田永遠, 宇野毅明, 橋本隆子, 豊田正史, 吉永直樹, 喜連川優, Luis EC Rocha, 小林亮太
- Journal Title
  
  Proceedings of the Annual Conference of JSAI
  
  Volume: JSAI2023 Issue: 0 Pages: 3L1GS1102-3L1GS1102
- DOI
  10.11517/pjsai.JSAI2023.0_3L1GS1102
- ISSN
  2758-7347
- Related Report
  2023 Research-status Report
- Open Access
[Journal Article] Polynomial-Delay Enumeration of Large Maximal Common Independent Sets in Two Matroids2023
- Author(s)
  Yasuaki Kobayashi, Kazuhiro Kurita, Kunihiro Wasa
- Journal Title
  
  Proceedings of 48th International Symposium on Mathematical Foundations of Computer Science (MFCS 2023)
  
  Volume: 270
- Related Report
  2023 Research-status Report
- Open Access
[Journal Article] A Framework to Design Approximation Algorithms for Finding Diverse Solutions in Combinatorial Problems2023
- Author(s)
  Tesshu Hanaka, Masashi Kiyomi, Yasuaki Kobayashi, Yusuke Kobayashi, Kazuhiro Kurita, Yota Otachi
- Journal Title
  
  Proceedings of The 37th AAAI Conference on Artificial Intelligence (AAAI-23)
  
  Volume: -
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] Evolution of Public Opinion on COVID-19 Vaccination in Japan: Large-Scale Twitter Data Analysis2022
- Author(s)
  Kobayashi Ryota、Takedomi Yuka、Nakayama Yuri、Suda Towa、Uno Takeaki、Hashimoto Takako、Toyoda Masashi、Yoshinaga Naoki、Kitsuregawa Masaru、Rocha Luis E C
- Journal Title
  
  Journal of Medical Internet Research
  
  Volume: 24 Issue: 12 Pages: e41928-e41928
- DOI
  10.2196/41928
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022
- Author(s)
  武富有香, 松田智裕, 須田永遠, 宇野毅明
- Journal Title
  
  人文科学とコンピュータシンポジウム論文集
  
  Volume: 1 Pages: 213-220
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] 大規模Twitterデータを用いた新型コロナワクチン接種に関する世論変化の分析2022
- Author(s)
  武富有香, 中山悠理, 須田永遠, 宇野毅明, 橋本隆子, 豊田正史, 吉永直樹, 喜連川優, Luis E C Rocha, 小林亮太
- Journal Title
  
  情報処理学会第85回全国大会発表予稿集
  
  Volume: - Pages: 445-446
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Journal Article] 複数テキストの利用による問いの広がりと深まり（批判的思考・創造的思考の育成を目指して）2022
- Author(s)
  松下達彦, 藤永清乃, 須田永遠, 武富有香, 江頭由美, 柿山礼美, 片山智子, 行田悦子
- Journal Title
  
  日本リメディアル教育学会第17回全国大会発表予稿集
  
  Volume: - Pages: 26-29
- Related Report
  2022 Research-status Report
[Journal Article] Extracting Cliches: Typify Slanderous Expressions Against the Confessions in the #MeToo Movement2022
- Author(s)
  Yuka Takedomi, Towa Suda, Kazuhiro Kurita, Ryota Kobayashi, Tomohiro Matsuda, Takeaki Uno
- Journal Title
  
  Digital Humanities Conference 2022 Conference Abstracts
  
  Volume: - Pages: 695-696
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022
- Author(s)
  宇野毅明, 武富有香, 小林亮太, 橋本隆子, 久保山哲二, 申吉浩
- Journal Title
  
  人文科学とコンピュータシンポジウム論文集
  
  Volume: -
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] Polynomial-Delay Enumeration of Large Maximal Matchings2022
- Author(s)
  Yasuaki Kobayashi, Kazuhiro Kurita, Kunihiro Wasa
- Journal Title
  
  Proceedings of The 48th edition of the International Workshop on Graph-Theoretic Concepts in Computer Science (WG2022), Lecture Notes in Computer Science
  
  Volume: 13453
- NAID
  130008051609
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Presentation] 誹謗中傷のナラティヴを測ることはできるか？定量的分析手法の開発とその課題2023
- Author(s)
  武富有香
- Organizer
  第11回AFSAコロキウム
- Related Report
  2023 Research-status Report
[Presentation] 日本語の大規模Twitterデータからみる新型コロナワクチン接種に関する人々の関心の推移2023
- Author(s)
  武富有香, 中山悠理, 須田永遠, 宇野毅明, 橋本隆子, 豊田正史, 吉永直樹, 喜連川優, Luis EC Rocha, 小林亮太
- Organizer
  2023年度人工知能学会全国大会
- Related Report
  2023 Research-status Report
[Presentation] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022
- Author(s)
  武富有香, 松田智裕, 須田永遠, 宇野毅明
- Organizer
  人文科学とコンピュータシンポジウム
- Related Report
  2022 Research-status Report
[Presentation] 複数テキストの利用による問いの広がりと深まり（批判的思考、創造的思考の育成を目指して）2022
- Author(s)
  松下達彦, 藤永清乃, 須田永遠, 武富有香, 江頭由美, 柿山礼美, 片山智子, 行田悦子
- Organizer
  日本リメディアル教育学会第17回全国大会日本語部会
- Related Report
  2022 Research-status Report
- Invited
[Presentation] 問いの循環による複数テキストの批判的統合：言語クラスにおける授業方法と教材の開発2022
- Author(s)
  松下達彦, 藤永清乃, 江頭由美, 柿山礼美, 片山智子, 行田悦子, 須田永遠, 武富有香
- Organizer
  「未来を創ることばの教育をめざして、内容重視の批判的言語教育のその後」第2回シンポジウム
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] Extracting Cliches: Typify Slanderous Expressions Against the Confessions in the #MeToo Movement2022
- Author(s)
  Yuka Takedomi, Towa Suda, Kazuhiro Kurita, Ryota Kobayashi, Tomohiro Matsuda, Takeaki Uno
- Organizer
  Digital Humanities Conference 2022
- Related Report
  2022 Research-status Report
[Presentation] 思想史ネットワーク分析／SNS解析のための日本語文体論の試みについて2022
- Author(s)
  須田永遠
- Organizer
  フランス現象学研究会（科研費基盤研究(C)「いわく言いがたいものの現象学：「フランス現象学」の生成と発展に関する研究」）
- Related Report
  2022 Research-status Report
- Invited
[Presentation] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022
- Author(s)
  宇野毅明, 武富有香, 小林亮太, 橋本隆子, 久保山哲二, 申吉浩
- Organizer
  人文科学とコンピュータシンポジウム
- Related Report
  2022 Research-status Report

Foundation of Japanese stylistics for social media analysis

Principal Investigator

須田 永遠 国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40933411)

¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)

Current Status of Research Progress

Reason

Report

Research Products

[Int'l Joint Research] ゲント大学(ベルギー)

Related Report

[Journal Article] 直観から遠く離れて──フランス文学研究者から見たアルゴリズム研究2024

Author(s)

Journal Title

Related Report

[Journal Article] On the hardness of inclusion-wise minimal separators enumeration2024

Author(s)

Journal Title

DOI

Related Report

[Journal Article] 研究者のパラダイスかと思いきや──異分野融合の現場からラボ長と研究員の対話2023

Author(s)

Journal Title

Related Report

[Journal Article] 何が分からないのか分からないので議論する──情報学の新しい問題カタログづくりの実際2023

Author(s)

Journal Title

Related Report

[Journal Article] Evolution of Public Opinion on COVID-19 Vaccination in Japan2023

Author(s)

Journal Title

DOI

ISSN

Related Report

[Journal Article] Polynomial-Delay Enumeration of Large Maximal Common Independent Sets in Two Matroids2023

Author(s)

Journal Title

Related Report

[Journal Article] A Framework to Design Approximation Algorithms for Finding Diverse Solutions in Combinatorial Problems2023

Author(s)

Journal Title

Related Report

[Journal Article] Evolution of Public Opinion on COVID-19 Vaccination in Japan: Large-Scale Twitter Data Analysis2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022

Author(s)

Journal Title

Related Report

[Journal Article] 大規模Twitterデータを用いた新型コロナワクチン接種に関する世論変化の分析2022

Author(s)

Journal Title

Related Report

[Journal Article] 複数テキストの利用による問いの広がりと深まり（批判的思考・創造的思考の育成を目指して）2022

Author(s)

Journal Title

Related Report

[Journal Article] Extracting Cliches: Typify Slanderous Expressions Against the Confessions in the #MeToo Movement2022

Author(s)

Journal Title

Related Report

[Journal Article] 多様性の解析を用いたニュース記事に対するコメント集合の分析2022

Author(s)

Journal Title

Related Report

[Journal Article] Polynomial-Delay Enumeration of Large Maximal Matchings2022

Author(s)

Journal Title

NAID

Related Report

[Presentation] 誹謗中傷のナラティヴを測ることはできるか？定量的分析手法の開発とその課題2023

Author(s)

Organizer

Related Report

[Presentation] 日本語の大規模Twitterデータからみる新型コロナワクチン接種に関する人々の関心の推移2023

Author(s)

Organizer

Related Report

[Presentation] #metoo に対する”誹謗中傷”的語りの類型化とアノテーション2022

須田永遠国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40933411)