2022 Fiscal Year Research-status Report
Combating Fake News: Early Detection, Potential Intent and Model Interpretability
Project/Area Number |
22K12271
|
Research Institution | Iwate University |
Principal Investigator |
張 建偉 岩手大学, 理工学部, 准教授 (20635924)
|
Co-Investigator(Kenkyū-buntansha) |
中島 伸介 京都産業大学, 情報理工学部, 教授 (90399535)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | フェイクニュース / 皮肉検出 / 事前学習言語モデル / 早期検出 / コンテキスト |
Outline of Annual Research Achievements |
本研究ではソーシャルメディアに焦点を当て,フェイクニュースの早期検出,潜在的意図の識別及び深層学習モデルの解釈可能性向上を目的とする.具体的には,(1)情報の解析優先度判別によるフェイクニュースの早期検出,(2)内容及びソーシャルコンテキストの分析による潜在的意図の識別,(3)判別根拠の抽出及び可視化による解釈可能な深層学習モデルの構築に関する技術開発に取り組む.本年度は特に(1)と(2)の課題を中心に研究を推進した. (1)の課題について,ニュースコンテンツとそれに関連するツイートデータを用いた,機械学習による2STEP のフェイクニュースの早期検出手法を提案した.STEP1 では,ニュース記事の発行直後を想定し,ニュースコンテンツのみを用いてフェイクニュースの早期検出を図る.STEP2 では,ニュース記事の拡散段階を想定し,STEP1 で真偽を判別できなかったニュースコンテンツに対し,ソーシャルコンテクストを時系列に沿って付与することにより真偽を判別していく.両方のSTEP において,真偽の予測確率が閾値以上のニュースを追跡対象から取り除くことで,検出の精度と早期性の両立を図る.提案手法を用いることにより,ニュースの拡散初期において,ベースラインと比較して精度とf 値の向上が確認された. (2)の課題について,事前学習言語モデル(BERT 及びRoBERTa,DeBERTa)を用いた文脈 理解,テキスト類コンテキスト及び非テキスト類コンテキストを考慮した皮肉文の検出手法を提案した.また,既存研究に多く利用されたハッシュタグで収集したデータセット以外に,皮肉投稿者により収集したデータセットにも手法を適用し,検出パーフォーマンスを比較した.テキスト類及び非テキスト類コンテキストそれぞれの特徴ベクトルを利用し,皮肉検出を行った結果,ベースラインと比較し優位な結果を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
三つの研究課題のうち,二つの課題を中心に進められており,もう一つの課題も検討し始めているため.
|
Strategy for Future Research Activity |
課題(1)については,実験を進めて,国際会議に投稿する予定である. 課題(2)については,フェイクニュースの潜在的意図をより詳しく分析する. 課題(3)については,解釈可能なフェイクニュース検出のモデルを構築する.
|
Causes of Carryover |
コロナの関係で,今年度に学会聴講と学会発表できなかった分,次年度に学会聴講や学会発表に使用する予定である.
|
Research Products
(5 results)