2020 Fiscal Year Research-status Report
Topic Transition Analysis from Millions of Tweets After Severe Disasters
Project/Area Number |
18K11443
|
Research Institution | Chiba University of Commerce |
Principal Investigator |
橋本 隆子 千葉商科大学, 商経学部, 教授 (80551697)
|
Co-Investigator(Kenkyū-buntansha) |
岡本 洋 東京大学, 大学院工学系研究科(工学部), 特任研究員 (00374067)
久保山 哲二 学習院大学, 付置研究所, 教授 (80302660)
|
Project Period (FY) |
2018-04-01 – 2022-03-31
|
Keywords | ビッグデータ解析 / ソーシャルメディア解析 / 時系列話題解析 / マイクロクラスタリング / データマイニング / デマ発見 / 話題多様性 |
Outline of Annual Research Achievements |
意義:本研究は大規模災害(東日本大震災等)時に投稿された数億件規模のTwitterデータを対象とし、話題の成長パターン分析とそのモデル化を行うことを目的としている。人々の行動や社会に対して大きな影響を与えるソーシャルメディア上の話題を可視化し、話題拡散の様子を示し、人々のコミュニケーション、話題の信頼性評価や議論の推移予測をサポートする技術の開発を目指す。 今年度の実績:今年度は東日本大震災後に投稿された大規模Twitterデータに対して、各種話題(デマやそうでない話題も含む)の成長の様子の時系列分析を行い、話題の多様性が、デマなどの拡散状況の指標となることを示すことができた。国立情報学研究所の宇野教授のデータ研磨手法を用い、話題クラスターの抽出を行い、分析パラメタ-として、話題全体を構成するツイート 数・話題クラスターの数、エントロピーを取り上げ、分位点回帰モデルにより、時系列変化を可視化した。その結果、デマのように人々が深く考えることなく拡散する情報の場合、多様性が低くなる傾向があるということを示すことができた。それに基づき、現在、モデル化を行い、その結果をThe Journal of Supercomputingに投稿し、学術論文として採択された。また、安倍首相の退陣、学術会議、近年大きな問題となっているコロナウイルス感染のTwitter分析についても着手し、感染やワクチンといった話題に関する人々の反応を調査解析し、我々のモデルがデマ拡散以外にも適用できるかについて調べている。 重要性:本研究により、たとえばデマ拡散などが話題の多様性が低い状況で行われていると思われることを示すことをモデル化出来た。安倍首相の退陣、学術会議、コロナウイルス感染のTwitterデータの解析にも着手しており、より社会の喫緊の課題に対応できる研究へと展開している。論文発表も順調に行っている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
理由 令和2年度は東日本大震災後に投稿された大規模Twitterデータに対して、各種話題(「石油コンビナート爆発」、「イソジンうがい」のデマや、「福島」、「宮 城」といった被災地方に関する話題、「被害」、「大丈夫」といった広く用いられた単語を含む話題など)の成長の様子の時系列分析を行い、話題の多様性を指標化し、モデルとして提案し、学術論文として採択された。話題全体を構成するツイート数・話題クラスター数にはリニア相関があること、一方で、話題の種類(デマ、通常の話題)によって、その形状に違いが見られることなどを可視化し、話題の多様性(同じツイート数 のときに、話題の数が少ないと多様性が低くなる)が重要な役割を果たすことを示すことが出来た。デマのように人々が深く考えることなく拡散する情報の場 合、多様性が低くなる。それに基づき、話題抽出結果に対して、話題全体を構成するツイート数・話題クラスターの数に注目し、時系列分析に取り組み、モデル化できたことが主な成果である。近年大きな問題となっているコロナウイルス感染のTwitter分析についても着手した。自然災害時のツイート分析のみならず、コロナウイルス感染のような災害時のツイートデータに対しても本研究を適用し、社会の喫緊の課題に対応できる研究に向けて展開しつつある。コロナ禍のため、海外出張は不可能となったが、オンラインでの国際学会発表、招待講演を順調に行った。
|
Strategy for Future Research Activity |
令和3年度は、前年度に実施した「話題の多様性」にもとづく話題成長パターンモデルをさらに展開するために、コロナに関する話題や、その他の時事話題に適用し、探索する。そしてデマ拡散時、通常時、炎上時などの状況を表現可能なモデルへと精緻化していく。非常時におけるTwitter上の話題抽出・検出として利用可能な手法を目指す。話題の検知には、投稿者の役割推定が重要となるため、投稿者の情報活用・解析も進めていく。特にコロナ感染のようなTwitterデータにおいては、投稿者解析が重要となるため、そのためのプログラム開発・実験を積極的に行う。実験環境を充実させるため、高性能PCの購入、大規模記憶装置の準備など、開発環境の整備を行っていく。特に数十万件規模のTweetに対して、適切な実行時間(数十分以内)で処理を終わらせることができるように、環境整備、アルゴリズムの改良を行っていく。 コロナ禍のため、海外出張がキャンセルとなっているため、その分の経費をプログラム開発の委託などに回す予定である。研究まとめ作業にも注力し、オンライン会議などを活用し、国内外に成果をアピールする。Webサイトによる情報発信も積極的に行っていく。
|
Causes of Carryover |
2020年度はコロナ禍のため、物理的な海外出張が困難となり、オンラインでの学会参加・発表が主な研究成果発表活動となった。そのため、予算があまり、2021年度に繰り越すこととなった。 2021年度は、引き続き研究を実施し、積極的に成果発表するとともに、Webサイトでの成果公開ページの作成など、広く社会に公開する活動を行う予定であり、そのサイト作成等に予算を利用する。
|
-
-
-
-
[Journal Article] Twitter Topic Progress Visualization using Micro-clustering2020
Author(s)
Hashimoto, T., Kusaba, A., Shepard, D., Kuboyama, T., Shin, K. and Uno, T.
-
Journal Title
Proceedings of the 9th International Conference on Pattern Recognition Applications and Methods
Volume: Volume 1
Pages: 585-592
DOI
Peer Reviewed / Int'l Joint Research
-
-
-
-
-
-
-
-
-
-
-
-
-
-