• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2013 Fiscal Year Research-status Report

世評・感情・倫理を考慮して柔軟に有害表現を検出する技術の開発とその応用

Research Project

Project/Area Number 24600001
Research InstitutionKitami Institute of Technology

Principal Investigator

桝井 文人  北見工業大学, 工学部, 准教授 (80324549)

Co-Investigator(Kenkyū-buntansha) RZEPKA Rafal  北海道大学, 情報科学研究科, 助教 (80396316)
木村 泰知  小樽商科大学, 商学部, 准教授 (50400073)
プタシンスキ ミハウ  北見工業大学, 工学部, 助教 (60711504)
Keywords有害情報抽出 / 世評情報 / 学校非公式サイト / ブログデータ / 感情情報 / 倫理情報
Research Abstract

本研究では,ネットパトロール活動による監視担当者にかかる負荷を軽減することを目的として,学校非公式サイトに書き込まれた有害表現を効率良く検出する技術の開発に取り組む.
今年度は,(1)学校非公式サイトおよび(2)インターネット掲示板における有害表現の調査と有害表現コーパスの構築,(3)有害表現と連関する世評表現,感情情報,倫理判断の調査を実施した.
(1),(2)については,国内の中学,高校,大学に関連する非公式サイトのデータを独自に収集した他,北海道庁の協力を経て道内の高校非公式サイトの書き込みデータの利用許諾を得た.独自収集したデータには人手による有害/無害の判定と表現の正規化を実施し,1,500文の評価用非公式サイトデータを作成した.また,SNSの書き込みデータも対象として,特定トピックに関するデータ収集にも着手した.
(3)については,収集したブログおよび学校非公式サイトに含まれる感情表現の出現傾向の調査を行い,有害表現と感情表現の関連性の分析を進めたが,有害表現と感情表現には有意な相関がないことがわかった.この結果を受けて,予定していた感情情報に基づく有害極性判定メソッドの実装は行わないこととした.同様に,学校非公式サイトの書き込みを対象として倫理判断情報の調査を開始した.また,世評を考慮に入れた有害極性判定メソッドの改良も進めた.本研究成果は複数の国内・国際会議にて発表した.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

今年度は,前年度見送ったインターネット情報書き込みデータの収集とそれらに含まれる有害表現に関する詳細な調査と,感情情報に基づく有害局性判定メソッドの設計・実装に取り組んだ.
前者については,国内の中学,高校,大学に関連する非公式サイトのデータを独自に収集した他,北海道庁の協力を経て道内の高校非公式サイトの書き込みデータの利用許諾を得た.独自収集したデータには人手による有害/無害の判定と表現の正規化を実施し,1,500文の評価用非公式サイトデータを作成した.
後者については,上記評価データを対象として,これらに含まれる感情表現の出現傾向の調査を行い,有害表現と感情表現の関連性を分析した.その結果,有害表現と感情表現には有意な相関がないことがわかった.この結果を受けて,予定していた感情情報に基づく有害極性判定メソッドの実装は行わないこととした.

Strategy for Future Research Activity

今後の研究推進については,以下のように予定している.
(1)インターネットにおける有害表現の調査:今回利用許諾を得た道内学校非公式サイトのデータを分析することで有害種単語および極性判定モデルの精緻化に資する知見を見出す.また,引き続きブログおよびSNSに記述される書き込みの収集にも努める.この作業は,木村と桝井,Ptaszynskiが中心となって進める.
(2)有害表現と連関する世評表現,倫理判断の調査:上記で得られるコーパスを利用して有害表現と連関する世評表現,倫理判断についての知見を得る.有害表現と倫理判断の関係性について考察する.この作業は,木村と桝井,Rzepkaが中心となって進める.
(3)倫理判断に基づく有害極性メソッドの設計と実装:書き込みデータ中に出現する倫理関係の調査を継続しつつ,倫理判断に基づく有害極性判定メソッドの設計と実装を行う.本メソッドはGENTAプロジェクトの常識解析エンジンを応用して構築する.この作業はRzepkaとPtaszynskiが主となって遂行する.

Expenditure Plans for the Next FY Research Funding

消耗品購入にあたり当初の見積りよりも安価に購入することになったため,若干の剰余が生じた.
次年度の消耗品費に充当し,予算の有効執行に努める.

  • Research Products

    (10 results)

All 2014 2013

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (8 results) Patent(Industrial Property Rights) (1 results)

  • [Journal Article] Society as a Life Teacher - Automatic Recognition of Instincts Underneath Human Actions by Using Blog Corpus2013

    • Author(s)
      Rafal Rzepka and Kenji Araki
    • Journal Title

      Computer Science, Social Informatics

      Volume: Volume 8238 2013 Pages: 370-376

    • DOI

      10.1007/978-3-319-03260-3_32

    • Peer Reviewed
  • [Presentation] 表層的言語情報から読みとれる直接性に着目したツイートログの分類2014

    • Author(s)
      福島裕斗, 桝井文人, Ptaszynski Michal, 中島陽子, 渡辺桂祐, 河石良太郎, 新田大征, 佐藤亮弥
    • Organizer
      第27回人工知能学会全国大会
    • Place of Presentation
      松山市
    • Year and Date
      20140512-20140515
  • [Presentation] Macroanalysis of Microblogs: An Empirical Study of Communication Strategies on Twitter2014

    • Author(s)
      Yuuto Fukushima, Fumito Masui, Michal Ptaszynski, Yoko Nakajima, Keisuke Watanabe, Ryotaro Kawaishi, Taisei Nitta and Ryoya Sato
    • Organizer
      AAAI2014 Spring Symposum on Big Data Becomes Personal: Knowledge into Meaning
    • Place of Presentation
      Stanford, USA
    • Year and Date
      20140324-20140326
  • [Presentation] Experience of Crowds as a Guarantee for Safe Artificial Self2014

    • Author(s)
      Rafal Rzepka and Kenji Araki
    • Organizer
      AAAI Spring Symposium on Implementing Selves with Safe Motivational Systems & Self-Improvement
    • Place of Presentation
      Stanford, USA
    • Year and Date
      20140324-20140326
  • [Presentation] Possible Usage of Sentiment Analysis for Calculating Vectors of Felific Calculus2013

    • Author(s)
      Rafal Rzepka and Kenji Araki
    • Organizer
      IEEE 13th International Conference on Data Mining Workshop “SENTIRE”
    • Place of Presentation
      Dallas, USA
    • Year and Date
      20131208-20131211
  • [Presentation] Detecting Cyberbullying Entries on Informal School Websites Based on Category Relevance Maximization2013

    • Author(s)
      Taisei Nitta, Fumito Masui, Michal Ptaszynski, Yasutomo Kimura, Rafal Rzepka, Kenji Araki
    • Organizer
      International Joint Conference on Natural Language Processing(IJCNLP2013)
    • Place of Presentation
      Nagoya, Japan
    • Year and Date
      20131014-20131018
  • [Presentation] SNSからの1次情報抽出に向けた表層的言語情報の分析2013

    • Author(s)
      福島裕斗, 桝井文人, Ptaszynski Michal, 中島陽子, 渡辺桂祐, 河石良太郎, 新田大征, 佐藤亮弥
    • Organizer
      情報処理北海道シンポジウム2013
    • Place of Presentation
      室蘭市
    • Year and Date
      20131005-20131005
  • [Presentation] Cyberbullying Detection Based on Category Relevance Maximization2013

    • Author(s)
      Taisei Nitta, Fumito Masui, Michal Ptaszynski, Yasutomo Kimura, Rafal Rzepka, Kenji Araki
    • Organizer
      Language Processing and Intelligent Information Systems 2013(LP&IIS'13)
    • Place of Presentation
      Warsaw, Poland
    • Year and Date
      20130617-20130618
  • [Presentation] カテゴリ別関連度最大化手法に基づく学校非公式サイトの有害書込み検出2013

    • Author(s)
      新田大征, 桝井文人, Ptaszynski Michal, 木村泰知, Rzepka Rafal, 荒木健治
    • Organizer
      第27回人工知能学会全国大会
    • Place of Presentation
      富山市
    • Year and Date
      20130604-20130606
  • [Patent(Industrial Property Rights)] インターネット上の有害書き込み検出装置及び方法2013

    • Inventor(s)
      桝井文人,ミハウ・プタシンスキ,新田大征
    • Industrial Property Rights Holder
      桝井文人,ミハウ・プタシンスキ,新田大征
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      特願2013-245813
    • Filing Date
      2013-11-28

URL: 

Published: 2015-05-28   Modified: 2023-03-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi