研究課題/領域番号 |
19K12230
|
研究機関 | 岩手大学 |
研究代表者 |
張 建偉 岩手大学, 理工学部, 准教授 (20635924)
|
研究分担者 |
中島 伸介 京都産業大学, 情報理工学部, 教授 (90399535)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | ネットいじめ / いじめ表現辞書 / 機械学習 / 早期検出 / 時系列データ / Twitter |
研究実績の概要 |
本研究課題では,ネットいじめの高精度・網羅的・早期的自動検出技術の開発を目的とする.具体的には,A) いじめ表現辞書の構築によるネットいじめの高精度識別技術の開発,B) コンテキスト分析に基づく潜在的ネットいじめの網羅的検出技術の開発,C) 時系列的ソーシャル分析に基づくネットいじめの早期発見技術の開発に取り組んでいる. 本年度は,研究計画の三つの課題のうち,特にA)の課題について中心に研究を推進し,B)とC)の課題においても最初の成果を得た. A)の課題について,Twitter上のテキストを対象とし,いじめ表現辞書を構築した.いじめ表現辞書とは,単語とその単語がどれだけいじめと関連するかの程度を数値で表すものである.今回の手法では,86,906語の単語を登録することが出来た.また,構築したいじめ表現辞書を含む複数の特徴量を用いて複数の機械学習手法と組合わせ,ネットいじめの自動検出に最適なモデルの構築を図った.構築したモデルを用いていじめ文,非いじめ文の分類の評価を行ったところ,多くの機械学習手法でいじめ表現辞書が正しい検出に貢献することがわかった.最も良かったモデルでは90%を超える評価を得ることができた. B)の課題について,潜在的ネットいじめの網羅的検出を目的とし,皮肉表現の自動抽出に着目した.ディープラーニング手法の1つである敵対的生成ネットワークGANの利用を検討していた. C)の課題について,Twitterイベントにおける特定情報の早期自動検出手法を提案した.イベントの発生規模とイベントを構成するツイートの時系列を考慮した,機械学習による2STEPの特定情報の早期検出手法を開発した.5つの機械学習モデルを使用して実験を行った結果,STEP1,STEP2ともにSVMが最適なモデルであり,本手法を用いることで早期検出を実現できるという結果が得られた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
おおむね順調に進展していると考える理由は次の通りである.まず,三つの課題のすべてについて1年目から最初の成果が出つつある.特に,A)の課題であるいじめ表現辞書の構築によるネットいじめの高精度識別技術の開発に関しては,大規模ないじめ表現を収集でき,ネットいじめの高精度の自動検出に貢献することを検証できた.B)の課題に関しては,分析対象と問題解決手法の方向性を固めることができ,C)の課題に関しては,早期検出の手法を提案できた.
|
今後の研究の推進方策 |
A)の課題については,より大規模な実験を行いたい.B)の課題については,より具体的な手法の検討を行いたい.C)の課題については,複数の早期検出手法を提案していきたい.
|
次年度使用額が生じた理由 |
本年度は学生が書く国際会議論文の英文校正の謝金を計上したが,教員が原稿を作成したため,その分の必要がなくなった. 次年度は難関の国際会議に投稿する予定で,英文校正に関わる経費を次年度に利用する.
|