本研究課題では,ネットいじめの高精度・網羅的・早期的自動検出技術の開発を目的とした.具体的には,A)いじめ表現辞書の構築によるネットいじめの高精度識別技術の開発,B)コンテキスト分析に基づく潜在的ネットいじめの網羅的検出技術の開発,C)時系列的ソーシャル分析に基づくネットいじめの早期発見技術の開発に取り組んでいた. 最終年度にB)の課題とC)の課題を進めたのみではなく,当初の提案書に記載しなかったモデル説明可能性の課題に向けて,解決手法を検証した. B)の課題について,潜在的ネットいじめの網羅的検出を目的とし,皮肉文の自動抽出に取り組んだ.コモンセンスを利用した皮肉検出手法が提案されているが,本研究では様々なコモンセンスの種類を用いて皮肉検出モデルの性能を比較し,適切なコモンセンスの種類の選別と複数の種類のコモンセンスを連結して利用する方法を試みた. C)の課題について,検出精度の向上と早期検出の両立を図るため,ソーシャルコンテクストを利用した,アンサンブル学習による早期検出手法を提案した.実験において,返信投稿数0件から5件までの検出時点におけるF1値がベースラインより高いことから,提案手法が早期検出に貢献することが確認された. また,説明可能なネットいじめ検出モデルの構築を目指して研究を進めた.モデルの説明とは,いじめと予測した投稿のテキストにおいて,その根拠となる部分を抜き出したものである.本研究では,既存モデルの事前学習モデルの変更,根拠学習の拡張,さらに,投稿の対象となるグループを予測するターゲット分類といじめ検出のマルチタスク学習を用いた説明可能なネットいじめ検出モデルを提案した.提案手法に基づき実験を行い,モデルの説明の内容を評価する説明可能性の観点で,既存モデルより向上する結果となった.
|