研究実績の概要 |
本研究の期間は令和3~5年度であり、フェイクニュース対策の技術的な手法を追求している。フェイクニュースの拡散予測、検知精度の向上、フェイクニュースを信じるユーザの説得と社会の分断の緩和を取り上げている。令和3年度には、フェイクニュースの拡散モデルの構築および、モデルを用いた拡散予測と検知を検討した。4年度には、フェイクニュース11件、リアルニュース10件から成る評価データの収集・整理、フェイクニュース拡散モデルの高速化、投稿画像からのフェイクニュースの検知を検討した。 最終年度(令和5年度)には、社会の分断の緩和に向けた方式を検討し、その大規模評価のためのデータを収集した。フェイクニュースの信奉者とリアルのニュースの信奉者を立場の異なる2つのユーザグループとみなし、これらのユーザの発信・転送する全ての投稿文中の単語集合との間で共クラスタリングを実施することで、2つのユーザグループに共通する話題およびグループ間で排反する話題を抽出する手法を検討した。その評価のために、令和4年度に収集した21件のニュースの発信・転送者10,438人の発した31,645,252件の投稿を収集した。これらの発信・転送者と、投稿文中の単語との間で共クラスタリングを実施すれば、2つのユーザグループにまたがるクラスターおよび一方のグループのみ含むクラスターを抽出し、各クラスターの単語から共通および排反トピックを抽出することが可能である。 また、急速に普及している生成系AIを用いたフェイクニュースの大量生成が懸念される一方、大規模言語モデルのフェイクニュース検知への応用が期待される。そこで、SNSの投稿文の作者が人間か生成系AIかを大規模言語モデルBERTを用いて識別する手法を検討し、10,184,707件の投稿文を用いて評価した結果、このサンプルでは99.9%のaccuracyを示した。
|