• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

正当な電子メールの特徴を利用した言語の種類に依存しない迷惑メールフィルターの開発

研究課題

研究課題/領域番号 21700078
研究機関山口大学

研究代表者

杉井 学  山口大学, 大学情報機構, 准教授 (00359910)

キーワード迷惑電子メール / 機械学習 / 電子メールフィルター
研究概要

正当な電子メールの特徴を利用した言語の種類に依存しない迷惑メールフィルターを開発するために、機械学習システムBONSAIを用いて、迷惑電子メールと正規電子メールに内在する文字列特徴の抽出を行った。文字列を一定の法則(漢字かな変換プログラムKAKASIを使用)にしたがって"分かち書き"処理し、文節または単語に分割して、文字列の出現頻度とその語順を組み合わせた情報を電子メールの特徴として決定木で表現する手法を用いた。また、Rough Readingと呼ばれる情報量を減らしながらも文章および文字列の特徴を抽出するための方法も組み合わせ、特徴抽出処理の高速化と言語の種類に依存しない新たな解析方法も取り入れた。
電子メールヘッダ情報を含む正規な電子メールと迷惑電子メールを学習例としたとき、決定木は正規な電子メールのヘッダ情報をノードに配して、非常に単純でしかも正確に正規電子メールと迷惑電子メールを分類する規則を表現した。この規則を利用した迷惑電子メールの分類実験では、既存のThundarbirdやPopfileといったベイジアンフィルターを用いたメールフィルターソフトと比べて勝るとも劣らない分類精度を得た。特に、正規電子メールを誤って迷惑電子メールに分類してしまう誤分類率はきわめて小さく、今後の実用化に向けた開発が期待される。
本研究によって、迷惑電子メールの分類を正規な電子メールの特徴を用いて行う、これまでにない新しい手法を提案することができた。

  • 研究成果

    (3件)

すべて 2009

すべて 学会発表 (3件)

  • [学会発表] メーリングリストを対象とした機械学習によるスパムメールの分類2009

    • 著者名/発表者名
      角朝香
    • 学会等名
      平成21年度 電気・情報関連学会中国支部第60回連合大会
    • 発表場所
      広島県・広島市立大学
    • 年月日
      2009-11-17
  • [学会発表] 機械学習を応用したスパムメールフィルタリング手法の検討と評価2009

    • 著者名/発表者名
      角朝香
    • 学会等名
      情報処理学会DPS研究会 第17回マルチメディア通信と分散処理ワークショップ
    • 発表場所
      北海道・層雲閣グランドホテル
    • 年月日
      2009-10-08
  • [学会発表] Performance Evaluation of Two e-mail Filtering Systems with Different Machine Learning Techniques2009

    • 著者名/発表者名
      Manabu Sugii
    • 学会等名
      The 24th International Technical Conference on Circuits/Systems, Computers and Communications
    • 発表場所
      Jeji KAL HOTEL, Jeji, Korea
    • 年月日
      2009-07-06

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi