研究課題/領域番号 |
23K21727
|
補助金の研究課題番号 |
21H03557 (2021-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2021-2023) |
応募区分 | 一般 |
審査区分 |
小区分62020:ウェブ情報学およびサービス情報学関連
|
研究機関 | 和歌山大学 |
研究代表者 |
風間 一洋 和歌山大学, システム工学部, 教授 (60647204)
|
研究分担者 |
土方 嘉徳 兵庫県立大学, 情報科学研究科, 教授 (10362641)
吉田 光男 筑波大学, ビジネスサイエンス系, 准教授 (60734978)
|
研究期間 (年度) |
2021-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2024年度: 3,120千円 (直接経費: 2,400千円、間接経費: 720千円)
2023年度: 3,900千円 (直接経費: 3,000千円、間接経費: 900千円)
2022年度: 4,810千円 (直接経費: 3,700千円、間接経費: 1,110千円)
2021年度: 5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
|
キーワード | ソーシャルメディア / 情報獲得 / ニュース / 分極度 / ラベル付け |
研究開始時の研究の概要 |
報道されたニュースがソーシャルメディア上で拡散・言及される現象に着目し,同一トピックに対する複数の報道機関(情報発信者)の報道とソーシャルメディアユーザ(情報受信者)の反応を相互に関係づけた報道・議論の2部グラフ構造から,視点間の相違の度合いや各視点のユーザの割合を測定し,構造の各部分の意味・役割を提示することで,それらの時系列変化を観測できる情報獲得システムを実現し,多くの事例に適用し有効性を評価する.
|
研究実績の概要 |
1) ニュース報道とそれに言及したツイートの時系列変化に関して山西らのChangeFinderを用いて検出した変化点に基づいて報道に対するユーザの言動に変化があった期間を推定し,その期間のツイートから特徴語とそれと係り受け関係にある形容詞や動詞を抽出し,極性に基づいて彩色することで,ニュースに対するユーザの反応をわかりやすく可視化する手法を開発した. 2) ニュース記事の引用分析に基づいてユーザネットワークの作成とクラスタリングを行い,さらにツイートのコメント部分の感情分析結果を用いて可視化することで,ニュース報道に対するTwitterユーザの反応を空間的に分析する手法を開発した. 3) 日々刻々と報道される膨大なニュース記事の中から特に注目される記事を発見するための引用数予想と,テキスト内容を短くわかりやすく要約するために,BERTやT5などの大規模言語モデルを用いたニュース記事の引用数予測と,レシピの概要からユーザの目に止まるような魅力的な題名生成の研究を行なった. 4) 英語,フランス語,日本語,ヒンディ語,ポルトガル語の5つの言語を対象に,2020年1月1日から2022年11月23日までの約3年間で収集した政治関連トピックのツイートの投稿種別や投稿頻度の多いユーザアカウントについて調査した.その結果,どの言語でも政治関連トピックと一般トピックを比べると,政治関連トピックの方が単純リツイートが多いことが分かった. 5) テレビアニメ作品を対象に情報拡散傾向の違いによる,ツイートに含まれる感情の違いに注目した分析を行った.週間ツイートユーザ数の推移傾向が上昇傾向にある場合,他の傾向よりもネガティブツイートの割合が高いなど,情報拡散傾向の違いにより,ツイートに含まれている感情にも違いが現れることを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
現在までの進捗状況は以下の通りである. 1) 報道・議論の情報収集・抽出システムの構築に関しては,時系列的な分析と空間的な分析を可能にした. 2) 報道・議論の対立度合いの定量化については,投稿した論文が不採録となったので,その修正と次の投稿先を検討中である. 3) 対立する複数の報道機関群・ユーザ群への意見や属性を表す動的ラベル付与に関しては,深層学習技術を用いた感情・極性分類器の採用により性能を向上させると共に,単語の係り受け関係を利用してわかりやすいラベルを付与すると共に,それらの新しい可視化手法を開発した.
|
今後の研究の推進方策 |
1) 報道・議論の情報収集・抽出システムに関しては,時系列的・空間的な分析が可能になると共に,それに対する感情や意味のラベルの付与などが充実してきたが,次年度はその手法をさらに改善するとともに,実際に長期にわたって分析して有効性を検証する. 2) 今年度は感情・極性分析の深層学習化により検出率と性能を大きく向上できたので,次年度は,感情的類似性を考慮した新しいクラスタリング手法を開発し,ユーザの分極化の分析に適用する. 3) 今年度はBERTやT5などの大規模言語モデルを用いた引用数予測や感情検出などを行ったが,次年度はより大規模なLLaMa2, 3やそれを日本語化したSwallowを用いて,分析に用いるNLP手法をさらに高性能化する. 4) 個人主義の国としてアメリカとフランス,集団主義の国として日本,インド,ブラジルを対象にして,ツイートの投稿種別や投稿頻度の多いユーザアカウントについて調査し,さらに感情語の割合を感情の種類ごとに調査を行う. 5) SNSの言及においては,対象に対する情報とその感想が混在するため,その分離手法を開発した上で,情報獲得・拡散における感情の効用をより詳細に分析する.テレビアニメ作品を対象とした際には,作品の内容(ストーリー)の説明と感想とを分離し,それぞれの感情を推定した上で,情報獲得・拡散において,内容説明と感想との感情をクロスで分析する.
|