研究課題/領域番号 |
15K16044
|
研究機関 | 北見工業大学 |
研究代表者 |
プタシンスキ ミハウ 北見工業大学, 工学部, 助教 (60711504)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
キーワード | ネットいじめ / パターン抽出 / 自然言語処理 |
研究実績の概要 |
利用予定データの収集及び取得済みデータの拡大を行った:(A)一般ブログコーパス,(B)有害表現コーパス(ネットパトロール記録),(C)うつ病的表現コーパス.このコーパスから全記事からうつ病に関係する記事の自動抽出を行った.さらに未処理の言語資源の前処理を行い文法情報及び感情情報のタグの付けを行った.更に有害書き込みの検出手法の最適化及び評価を行った.その中機械学習用の環境を構築しSPEC文パターン抽出手法を用いて(B)のコーパスから正例・不例を抽出した.抽出したパターンを(A)によってフィルタリングを行い有効のパターンのみを学習用のフィーチャとして登録した.有効なフィーチャを基に機械学習し,システム評価し,その結果はIJCAI2015国際会議にて成果発表した.また更なる最適化手法をACM-SoCC国際会議にて発表を行った.そして,多数の分類機を最適化した徹底的な成果の分析をLTC-EDOワークショップにて発表を行った.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
本研究課題を行うに当たって、当初計画よりも進展があり、ほとんどのシステムコンポネントが完了し、平成28年度に計画を立てていた研究の一部を平成27年度中に実施した。そのため、平成27年度当初に予定していたよりも多くの研究成果を発表することが可能となった.
|
今後の研究の推進方策 |
平成28年度の研究実施計画 今後はうつ病書き込み検出手法の開発及び評価を行う.そこで,研究実績の概要に記載した実験方法と,文パターン抽出手法を用いて(B)のコーパスから正例・ 不例を抽出する.抽出したパターンを(A)によてフィルタリングし,有効のパターンのみを学習用のフィーチャとして登録する.有効なフィーチャを 基に機械学習を行い,分類機の訓練を行う.またその評価方式を設定する.その中,各手法の自動評価実験.そこから得られた結果を分析しエラーの修正を行い,分類機の最適化に用いる.この段階までの研究成果を公開し国際会議,そして学術雑誌において発表する その次,感情解析システム及び上記の2つの手法との統合し,実証実験を行う.まず,有害書き込み検出手法及びうつ病書き込み検出手法のインターネット(SNS)上に性能を確認する.さらに評価の結果を分析し,エラーの修正を行い,最後に手法の統合によってシステムを構築する.
平成29年度の研究実施計画 研究の最後の段階では,これまで作ってきた手法をモバイルコンピュータ用のアプリケーションとして携帯電話やスマホなどに応用する.そこでまず,アプリケーションのインターフェース仕様を確立する.更に統合した手法をインターフェースに応用し,性能評価及び最適化(エラー分析・修正,インターフェース最適化)を行う.最後に研究成果を公開し国際会議及び学術雑誌において成果を発表する.
|