Combating Fake News: Early Detection, Potential Intent and Model Interpretability
Project/Area Number |
22K12271
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62020:Web informatics and service informatics-related
|
Research Institution | Iwate University |
Principal Investigator |
張 建偉 岩手大学, 理工学部, 准教授 (20635924)
|
Co-Investigator(Kenkyū-buntansha) |
中島 伸介 京都産業大学, 情報理工学部, 教授 (90399535)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2022: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
|
Keywords | フェイクニュース / 皮肉検出 / 事前学習言語モデル / 早期検出 / コンテキスト / 早期発見 / 潜在的意図 / 解釈可能性 |
Outline of Research at the Start |
近年デジタル化の波と共に,ソーシャルメディア上のフェイクニュースが深刻な問題となっている.フェイクニュースは政治・経済等多くの分野に悪影響を与えるとされており,機械学習を用いたフェイクニュースの検出は活発に研究されているが,その性能はまだ十分とは言えない.そこで本研究では,フェイクニュースの①早期検出・②潜在的意図の識別・③深層学習モデルの解釈可能性に主眼を置いた,実用的なフェイクニュース検出システムの実現を目指す.
|
Outline of Annual Research Achievements |
本研究ではソーシャルメディアに焦点を当て,フェイクニュースの早期検出,潜在的意図の識別及び深層学習モデルの解釈可能性向上を目的とする.具体的には,(1)情報の解析優先度判別によるフェイクニュースの早期検出,(2)内容及びソーシャルコンテキストの分析による潜在的意図の識別,(3)判別根拠の抽出及び可視化による解釈可能な深層学習モデルの構築に関する技術開発に取り組む.本年度は特に(1)と(2)の課題を中心に研究を推進した. (1)の課題について,ニュースコンテンツとそれに関連するツイートデータを用いた,機械学習による2STEP のフェイクニュースの早期検出手法を提案した.STEP1 では,ニュース記事の発行直後を想定し,ニュースコンテンツのみを用いてフェイクニュースの早期検出を図る.STEP2 では,ニュース記事の拡散段階を想定し,STEP1 で真偽を判別できなかったニュースコンテンツに対し,ソーシャルコンテクストを時系列に沿って付与することにより真偽を判別していく.両方のSTEP において,真偽の予測確率が閾値以上のニュースを追跡対象から取り除くことで,検出の精度と早期性の両立を図る.提案手法を用いることにより,ニュースの拡散初期において,ベースラインと比較して精度とf 値の向上が確認された. (2)の課題について,事前学習言語モデル(BERT 及びRoBERTa,DeBERTa)を用いた文脈 理解,テキスト類コンテキスト及び非テキスト類コンテキストを考慮した皮肉文の検出手法を提案した.また,既存研究に多く利用されたハッシュタグで収集したデータセット以外に,皮肉投稿者により収集したデータセットにも手法を適用し,検出パーフォーマンスを比較した.テキスト類及び非テキスト類コンテキストそれぞれの特徴ベクトルを利用し,皮肉検出を行った結果,ベースラインと比較し優位な結果を得た.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
三つの研究課題のうち,二つの課題を中心に進められており,もう一つの課題も検討し始めているため.
|
Strategy for Future Research Activity |
課題(1)については,実験を進めて,国際会議に投稿する予定である. 課題(2)については,フェイクニュースの潜在的意図をより詳しく分析する. 課題(3)については,解釈可能なフェイクニュース検出のモデルを構築する.
|
Report
(1 results)
Research Products
(5 results)