2017 Fiscal Year Research-status Report
子どものネットいじめを防止するための造語・隠語と文脈に対応した有害表現の自動判定
Project/Area Number |
17K13254
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西原 陽子 立命館大学, 情報理工学部, 准教授 (70512101)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | ネットいじめ / 不適切表現 |
Outline of Annual Research Achievements |
本研究の目的は、ネットいじめに関わる不適切な表現を自動判定する方法を構築し、ネットいじめを減少させることである。 本年度は以下の2点を実施した。1点目は、ネット上のいじめに関わる不適切な表現を収集したことである。2点目は、不適切な表現の言語特徴を明らかにし、不適切な表現を自動判定するための言語モデルを作成したことである。 1点目の実施の詳細を述べる。ネット上のいじめに関わる不適切な表現が掲載されることが多いWebサイトから、掲載されている文を自動収集するプログラムを作成し、収集を行なった。その後、人手により不適切な表現が含まれる文と、それ以外に分類した。さらに、不適切な表現が含まれる文については4種類に分類した。 2点目の実施の詳細を述べる。全ての文に対してその種類を表すラベルを付与した。具体的には不適切な文の4種類に対してと、不適切な表現が含まれない文に対してラベルを付与した。ラベルの系列をLong Short Term Memoryにて学習し、言語モデルを作成した。これにより、文を構成する単語の情報と、文書を構成する文の並びの情報の両方から、次にくる文が不適切な表現を含む文か否かが評価可能となった。 今年度の成果の意義は、不適切な表現を含む言語モデルを作成したことにより、隠語や造語を含む不適切な表現の文も判定できるようになったことである。 今年度の成果の重要性は、文脈を考慮したことによりある文脈では不適切表現であっても、別の文脈では不適切表現とならないものを判定できる可能性が生まれたことである。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
平成30年度に予定していた文脈を考慮した言語モデルの作成に着手できたため。
|
Strategy for Future Research Activity |
平成30年度は当初の計画通り、文脈を考慮した上で不適切な表現を自動判定する言語モデルを完成させる。研究が予定よりもスムーズに進んだ場合は、平成31年度に実施予定である計画を前倒しで行う。
|
Causes of Carryover |
その他で使用する項目が当初の予定よりも廉価で済んだため、当該助成金が生じた。次年度のその他に繰り越し使用する計画である。
|
Research Products
(1 results)