2018 Fiscal Year Research-status Report
子どものネットいじめを防止するための造語・隠語と文脈に対応した有害表現の自動判定
Project/Area Number |
17K13254
|
Research Institution | Ritsumeikan University |
Principal Investigator |
西原 陽子 立命館大学, 情報理工学部, 准教授 (70512101)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 不適切表現 / 言い換えの獲得 / 時系列深層学習 / 文脈の学習 |
Outline of Annual Research Achievements |
本研究の目的は、ネットいじめに関わる不適切な表現を自動判定する方法を構築し、ネットいじめを減少させることである。 本年度は以下の2点を実施した。1点目は表現が含まれる文脈を表す言語特徴を明らかにしたことである。2点目は文脈を考慮した上で不適切表現を自動判定するモデルを構築したことである。
1点目の実施の詳細を述べる。まず、文脈は文の並びにより表現されるとした。ある文の中に不適切表現の言い換えが含まれる場合、文の中にある他の単語と不適切表現には関連があると考えられる。仮に不適切表現の言い換えを取り除き、不適切表現そのものに入れ替えたとしても、関連があるため文としての違和感はないと考えられる。このように不適切表現を言い換えたとしても共有する単語がある。それを学習し、不適切表現の言い換えを獲得する方法を考えた。
2点目の実施の詳細を述べる。文脈を考慮した上で不適切表現を自動判定するモデルを構築した。時系列深層学習器の一種であるLong short-term memoryを用いて、文を単語のベクトルで表現し、ベクトルの系列を学習させてモデルを構築した。国内と国外で研究発表を行い、研究成果の報告を行った。国内はウェブインテリジェンスとインタラクション研究会で発表をし、聴講者と議論をした。国外はThe 2019 IAENG International Conference on Data Mining and Applicationsで発表をし、聴講者と議論をした。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
予定していた実施項目を達成できたため。
|
Strategy for Future Research Activity |
当初の計画通り、得られた言語モデルがネットいじめに与える影響を評価する実験を実施する。
|
Causes of Carryover |
今年度使用予定であった備品費用が安く済んだこと、および旅費が抑えられたことで次年度使用額が生じた。使用計画としては、最終的に研究をまとめる上で必要な研究資料収集のための学会聴講を行うこと、学会発表を多角的に行うことなどを考えている。
|
Research Products
(2 results)