研究課題/領域番号 |
24600001
|
研究機関 | 北見工業大学 |
研究代表者 |
桝井 文人 北見工業大学, 工学部, 准教授 (80324549)
|
研究分担者 |
RZEPKA Rafal 北海道大学, 情報科学研究科, 助教 (80396316)
木村 泰知 小樽商科大学, 商学部, 准教授 (50400073)
プタシンスキ ミハウ 北見工業大学, 工学部, 助教 (60711504)
|
研究期間 (年度) |
2012-04-01 – 2015-03-31
|
キーワード | 関連度 / 有害表現抽出 / 世評表現 / 倫理判断 / 学校非公式サイト |
研究実績の概要 |
本研究では,ネットパトロール活動による監視担当者にかかる負荷を軽減することを目的として,学校非公式サイトに書き込まれた有害表現を効率良く検出する技術の開発に取り組んだ.今年度は,特に(1)インターネットにおける有害表現の調査,(2)有害表現と連関する世評表現,倫理判断の調査,(3)倫理判断に基づく有害極性メソッドの設計と実装,を実施した. (1)については,前年度までに収集したデータを分析することで,有害種単語および極性判定モデルの精緻化に資する知見を見出した.道内学校非公式サイトのデータのみでは規模が小さく,統計的知見を見出すことが困難であるため,WWW上のデータも合わせて分析した.時間の推移とともに変化する有害表現と時間の推移に関わらず頻出する有害表現が存在することがわかった.この知見に基づけば,時間の推移に関わらず頻出する有害表現(有害語)を高優先度の種単語として用いることで,時間の推移による表現の変化にも強い検出につながると期待できる. (2),(3)については,書き込みデータ中に出現する倫理関係の調査を継続しつつ,倫理判断に基づく有害極性メソッドの設計を行った.GENTAプロジェクトの常識解析エンジンを応用して有害表現と倫理判断の関連性を抽出する実験と有効性の検証を行った.その結果,倫理判断処理は有害表現抽出に対して一定の効果を示したが,高い抽出性能を確保するためには,より多くの関連要素を考慮する必要があることがわかった.性能向上を図るためには,文脈処理や固有名詞の曖昧性解消など,当初予想されたものより難易度の高い処理が必要であり,さらなる性能向上には研究計画年度を越えた取り組み継続が必要である. 本研究の成果は,複数の国際会議にて公表しており,さらに一部の成果は平成27年度に国際会議,雑誌にて公表する予定である.
|