2022 Fiscal Year Research-status Report
Foundation of Japanese stylistics for social media analysis
Project/Area Number |
22K12285
|
Research Institution | National Institute of Informatics |
Principal Investigator |
須田 永遠 国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (40933411)
|
Co-Investigator(Kenkyū-buntansha) |
栗田 和宏 名古屋大学, 大学院情報学研究科, 助教 (40885266)
武富 有香 国立情報学研究所, 情報学プリンシプル研究系, 特任研究員 (60941101)
|
Project Period (FY) |
2022-04-01 – 2027-03-31
|
Keywords | ソーシャルメディア / 意味解釈 / 心的状態 / 言語的特徴 / 人々の関心の変化 / ナラティヴの類型 / テキストマイニング / 準最適解の列挙 |
Outline of Annual Research Achievements |
本年度は、ソーシャルメディアの書き手の反応や心的状態の類型および言語的特徴に関する知見を獲得するため、実際に国内で影響力のある二つのソーシャルメディアを対象としてテキストデータを収集し、分析を行った。並行して本研究に必要なマイニング技術を下支えするアルゴリズムの開発も行い、これらの成果を国内外の会議や論文誌で発表した。詳細は以下の通りである。 (i) ワクチンに関する大規模なTwitterデータの分析:新型コロナウイルスワクチン接種期間中にTwitterで投稿された「ワクチン」の語を含む1億件以上の日本語の全ツイートデータを収集し、クラスタリング技術を用いてトピックごとに分類し、人手による意味解釈とアノテーションを施した上で時系列解析を行った。その結果、職域接種の開始を境に、人々の関心が社会的トピックから個人的事柄へと推移したことが明らかになった。 (ii) Yahoo!コメント上の#metooに対する中傷の類型化とアノテーション:#metoo運動以降、Yahoo!コメントに現れるようになった女性に対する誹謗中傷的ナラティヴを人手で読解・精査し、類型を作成、その類型にしたがってコメントにアノテーションを行うことで性暴力トピックに対する書き手の典型的な反応を析出し、反応の分布を明らかにした。その結果の一部は従来のミソジニーに関する人文学的研究の知見を定量的に証明するものとなった。 (iii) テキストマイニング技術の基礎となるアルゴリズムの開発:大量のテキストデータから書き手の心的状態と結びついた言語的特徴の累計を析出するには、まず限られたテキストを人手で解釈する必要があるが、その際にはある条件を満たす文を効率よくマイニングする情報学的な技術が必須である。こうした技術を下支えするアルゴリズム、本年度は特に条件をできるだけ満たす解(準最適解)を列挙するアルゴリズムの開発を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通り、ソーシャルメディア上で感情が表出されたテキストについて高度な意味解釈を通じた言語的特徴の析出を行い、成果として発表することができている。特に、新型コロナワクチンに関する大規模Twitterデータの分析は、国内の全ツイートを対象とした解析の試みであり、国際トップジャーナルに採択され、ニュースリリースも配信された。学術的価値だけでなく社会的にもインパクトの高い研究成果となった。テキストマイニングの基礎となるアルゴリズムの開発も順調に進んでいる。 本研究は分野横断的な研究であり、協働の方法論自体の構築も必須であるが、その意味で、本年度採用した情報学の技術と文学の読解技術とを組み合わせた研究スタイルが順調に成果を生んでいることは、次年度以降の研究を方向付けるものとなるだろう。
|
Strategy for Future Research Activity |
新型コロナワクチン、性暴力被害者へのバッシングに加えて、より広いトピックについてのソーシャルメディアデータを対象に心的状態に結びついた言語的特徴の分析を進めていく。それとともに、複数のトピックに対して共通して現れる言語的特徴や、反応の類型の分析を進めることで、より一般的な文体論を構築するための知見を増やしていく。 またこの程公開された大規模言語モデルに基づく生成AIは、本研究で行うテキストへのアノテーションや意味解釈において補助的な役割を担い、研究をより一層加速させるためのツールとなることが期待される。有効な利活用の方法も含めて、研究を進めていきたい。
|