2017 年度実施状況報告書

子どものネットいじめを防止するための造語・隠語と文脈に対応した有害表現の自動判定

研究課題

研究課題/領域番号	17K13254
研究機関	立命館大学
研究代表者	西原陽子立命館大学, 情報理工学部, 准教授 (70512101)
研究期間 (年度)	2017-04-01 – 2020-03-31
キーワード	ネットいじめ / 不適切表現
研究実績の概要	本研究の目的は、ネットいじめに関わる不適切な表現を自動判定する方法を構築し、ネットいじめを減少させることである。本年度は以下の2点を実施した。1点目は、ネット上のいじめに関わる不適切な表現を収集したことである。2点目は、不適切な表現の言語特徴を明らかにし、不適切な表現を自動判定するための言語モデルを作成したことである。 1点目の実施の詳細を述べる。ネット上のいじめに関わる不適切な表現が掲載されることが多いWebサイトから、掲載されている文を自動収集するプログラムを作成し、収集を行なった。その後、人手により不適切な表現が含まれる文と、それ以外に分類した。さらに、不適切な表現が含まれる文については4種類に分類した。 2点目の実施の詳細を述べる。全ての文に対してその種類を表すラベルを付与した。具体的には不適切な文の4種類に対してと、不適切な表現が含まれない文に対してラベルを付与した。ラベルの系列をLong Short Term Memoryにて学習し、言語モデルを作成した。これにより、文を構成する単語の情報と、文書を構成する文の並びの情報の両方から、次にくる文が不適切な表現を含む文か否かが評価可能となった。今年度の成果の意義は、不適切な表現を含む言語モデルを作成したことにより、隠語や造語を含む不適切な表現の文も判定できるようになったことである。今年度の成果の重要性は、文脈を考慮したことによりある文脈では不適切表現であっても、別の文脈では不適切表現とならないものを判定できる可能性が生まれたことである。
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由平成３０年度に予定していた文脈を考慮した言語モデルの作成に着手できたため。
今後の研究の推進方策	平成３０年度は当初の計画通り、文脈を考慮した上で不適切な表現を自動判定する言語モデルを完成させる。研究が予定よりもスムーズに進んだ場合は、平成３１年度に実施予定である計画を前倒しで行う。
次年度使用額が生じた理由	その他で使用する項目が当初の予定よりも廉価で済んだため、当該助成金が生じた。次年度のその他に繰り越し使用する計画である。

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] ドメインにより意味が変化する単語に着目した不適切な表現のフィルタリング2017
- 著者名/発表者名
  近江龍一、西原陽子、山西良典
- 学会等名
  JSAI2017