• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

正規メール特徴を重視し単語属性に着目した高精度・高速フィルタリング手法の開発

研究課題

研究課題/領域番号 16K12438
研究種目

挑戦的萌芽研究

配分区分基金
研究分野 情報セキュリティ
研究機関山口大学

研究代表者

杉井 学  山口大学, 国際総合科学部, 准教授 (00359910)

研究分担者 松野 浩嗣  山口大学, 大学院創成科学研究科, 教授 (10181744)
研究期間 (年度) 2016-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2016年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワードメールフィルタ / スパムメール / 属性情報 / Jaccard係数 / 機械学習 / テキストマイニング / 単語属性 / 共出現 / メールフィルター / JACCARD係数 / 共起関係 / 共起ネットワーク / 多次元尺度法 / 語順 / 情報フィルタリング
研究成果の概要

電子メール(以下メール)中の単語ではなく、その属性情報によってスパムメールを分類するメールフィルタ手法の開発が目的であった。これまでの単純な単語の出現頻度という属性に加え、品詞ごとの出現頻度や複数の単語が共出現する頻度(Jaccaard係数)、また一般的な辞書に存在しない単語のみの属性情報を用いることで、これまで以上にメール本文の特徴を捉えることができ、スパムメールを効率よく自動分類できることを明らかにした。

研究成果の学術的意義や社会的意義

これまでのメールフィルタに用いられてきたメールを特徴付ける要素は、人が見た目で容易に判断できる単語そのものであったり、単純な単語の出現頻度であった。本研究課題での成果は、メールを特徴付ける新たな単語の属性情報を発見したことや、これまで注目されていなかった一般的な辞書に存在しない単語の属性情報の重要性を明らかにしたことなどである。特に後者は、メールフィルター研究において新たな展開をもたらすことにつながり、学術的意義は大きい。また、様々なメールフィルタシステムが開発される中で進む、スパムメール流通量の増加を鑑みれば、ネットワーク資源の効率的かつ適切な利用に向けた改善策としての社会的意義は大きい。

報告書

(5件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 2016 実施状況報告書
  • 研究成果

    (7件)

すべて 2019 2018 2017

すべて 学会発表 (7件) (うち国際学会 3件)

  • [学会発表] The Document Similarity Index based on the Jaccard Distance for Mail Filtering2019

    • 著者名/発表者名
      Manabu Sugii, Seiya Temma, Hiroshi Matsuno
    • 学会等名
      The 34th International Technical Conference on Circuit/Systems Computers and Communications
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] メールフィルタのためのテキストマイニングを用いた属性情報の探索2019

    • 著者名/発表者名
      天満 誠也、杉井 学、松野 浩嗣
    • 学会等名
      電気情報通信学会(MSS研究会)
    • 関連する報告書
      2019 実績報告書
  • [学会発表] Jaccard係数を用いた単語の共起度に基づくメールフィルタの提案2019

    • 著者名/発表者名
      天満誠也、杉井 学、松野浩嗣
    • 学会等名
      電子情報通信学会 システム数理と応用研究会(MSS)
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Searching Attribute Information for Mail Filtering based on Text Mining2018

    • 著者名/発表者名
      Seiya Temma, Manabu Sugii, Hiroshi Matsuno
    • 学会等名
      The 33rd International Technical Conference on Circuit/Systems Computers and Communications
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] メールフィルタのためのテキストマイニングを用いた属性情報の探索2018

    • 著者名/発表者名
      天満 誠也、杉井 学、松野 弘嗣
    • 学会等名
      電子情報通信学会 システム数理と応用研究会
    • 関連する報告書
      2017 実施状況報告書
  • [学会発表] ベイジアン方式メールフィルタリングにおける変換単語の属性情報探索2017

    • 著者名/発表者名
      藤井 望、杉井 学、松野 浩嗣
    • 学会等名
      電子情報通信学会 システム数理と応用研究会
    • 発表場所
      島根大学(島根県・松江市)
    • 年月日
      2017-03-16
    • 関連する報告書
      2016 実施状況報告書
  • [学会発表] An Effect of Word Order for Mail Classification by Bayesian Method2017

    • 著者名/発表者名
      Manabu Sugii, Nozomi Fujii, Hiroshi Matsuno
    • 学会等名
      The 32th International Technical Conference on Circuit/Systems Computers and Communications
    • 関連する報告書
      2017 実施状況報告書
    • 国際学会

URL: 

公開日: 2016-04-21   更新日: 2021-02-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi