研究課題/領域番号 |
19K12230
|
研究機関 | 岩手大学 |
研究代表者 |
張 建偉 岩手大学, 理工学部, 准教授 (20635924)
|
研究分担者 |
中島 伸介 京都産業大学, 情報理工学部, 教授 (90399535)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | ネットいじめ / いじめ表現辞書 / 機械学習 / 早期検出 / GCN / Twitter |
研究実績の概要 |
本研究課題では,ネットいじめの高精度・網羅的・早期的自動検出技術の開発を目的とする.具体的には,A) いじめ表現辞書の構築によるネットいじめの高精度識別技術の開発,B) コンテキスト分析に基づく潜在的ネットいじめの網羅的検出技術の開発,C) 時系列的ソーシャル分析に基づくネットいじめの早期発見技術の開発に取り組んでいる. 本年度は,研究計画の三つの課題を進めて一定の成果を上げた. A) の課題について,前年度はTwitter上のテキストを対象として構築したいじめ表現辞書を含む複数の特徴量と複数の機械学習手法を組合わせて,ネットいじめの自動検出に最適なモデルの構築を図った.今年度は異なる時期からツイートを収集し,新たないじめ表現辞書を特徴量として用いると評価はどう変わるか,また,異なる時期から収集したデータセットを用いると評価はどう変わるかについて検証した. B) の課題について,潜在的ネットいじめの網羅的検出を目的とし,皮肉文の自動抽出に取り組んだ.日本語Twitterデータセットを構築し,BERT及び絵文字を利用して,皮肉文の検出を行った.文脈を読むことが可能なBERTモデルをベースとし,さらに文中に存在する絵文字から特徴ベクトルを取得することで,従来より検出精度の向上を確認できた. C) の課題について,Twitterイベントにおける特定情報の早期自動検出手法を検討した.関連研究を調査したところ,ユーザ特徴が利用されることが多いが,テキスト特徴を加えることで,早期検出の可能性を議論した.また,検出に機械学習の新しいモデルGCNの利用を提案した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
理由 おおむね順調に進展していると考える理由は次の通りである.まず,三つの課題のすべてについて成果が出つつある.A)の課題であるいじめ表現辞書の構築によるネットいじめの高精度識別技術の開発に関しては,大規模ないじめ表現を収集でき,ネットいじめの高精度の自動検出に貢献することを検証できた.B)の課題に関しては,新しいモデルBERTとテキスト以外の絵文字の特徴を用いることで,皮肉文の検出精度の向上を確認でき,潜在的ネットいじめの検出可能性を示した.C)の課題に関しては,早期検出にむけて,ユーザ情報とテキスト情報の結合や新しいモデルGCNの利用を検討した.
|
今後の研究の推進方策 |
A) の課題については,手法と実験をまとめて,論文の形で成果を上げたい. B) の課題については,コンテキスト分析を用いて,皮肉文の検出の効果を検証していきたい. C) の課題については,手法の具体化と実験による検証を進めていきたい.
|
次年度使用額が生じた理由 |
本年度はコロナの影響で旅費を使わなかったため,次年度使用額が生じた. 次年度はコロナが収束すれば,研究調査や会議参加に旅費を使用する予定である.
|