研究課題/領域番号 |
19K12230
|
研究機関 | 岩手大学 |
研究代表者 |
張 建偉 岩手大学, 理工学部, 准教授 (20635924)
|
研究分担者 |
中島 伸介 京都産業大学, 情報理工学部, 教授 (90399535)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
キーワード | ネットいじめ / 皮肉検出 / 機械学習 / 事前学習言語モデル |
研究実績の概要 |
本研究課題では,ネットいじめの高精度・網羅的・早期的自動検出技術の開発を目的とする.具体的には,A)いじめ表現辞書の構築によるネットいじめの高精度識別技術の開発,B)コンテキスト分析に基づく潜在的ネットいじめの網羅的検出技術の開発,C)時系列的ソーシャル分析に基づくネットいじめの早期発見技術の開発に取り組んでいる. 本年度は,研究計画の三つの課題を進めて一定の成果を上げた. A)の課題について,いじめ表現辞書を含む複数の特徴量と複数の機械学習手法を組合わせたネットいじめの自動検出手法と,異なる時期で構築したいじめ表現辞書の分類に対する効果の評価をまとめて,国際論文誌論文を発表した. B)の課題について,潜在的ネットいじめの網羅的検出を目的とし,皮肉文の自動抽出に取り組んだ.事前学習言語モデル(BERT及びRoBERTa,DeBERTa)を用いた文脈理解,テキスト類コンテキスト及び非テキスト類コンテキストを考慮した皮肉文の検出手法を提案した.また,既存研究に多く利用されたハッシュタグで収集したデータセット以外に,皮肉投稿者により収集したデータセットにも手法を適用し,検出パーフォーマンスを比較した.テキスト類及び非テキスト類コンテキストそれぞれの特徴ベクトルを利用し,皮肉検出を行った結果,ベースラインと比較し優位な結果を得た. C)の課題について,コンテンツとそれに関連するツイートデータを用いた,機械学習による2STEPの特定情報の早期検出手法を提案した.両方のSTEPにおいて,予測確率が閾値以上の情報に対してラベルを確定させて追跡対象から取り除くことで,検出の精度と早期性の両立を図った.提案手法を用いることにより,特定情報の拡散初期において,ベースラインと比較して精度とF値の向上が確認された.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本研究課題は,コロナの関係で,補助事業期間が「令和元年度~令和3年度」から「令和元年度~令和4年度」へ変更されたものである.延長期間中にも研究を進めて,国際論文誌の論文採択や国内研究会の発表という研究成果を出し続けていたため.
|
今後の研究の推進方策 |
ネットいじめの自動検出については,マルチモーダルなデータの解析や,事前学習言語モデルに知識ベースを融合する手法を検討していきたい.
|
次年度使用額が生じた理由 |
コロナの関係で,今年度に学会聴講と学会発表できなかった分は,次年度に学会聴講や学会発表の参加費と旅費に使用する予定である.
|