研究課題/領域番号 |
16K12438
|
研究種目 |
挑戦的萌芽研究
|
配分区分 | 基金 |
研究分野 |
情報セキュリティ
|
研究機関 | 山口大学 |
研究代表者 |
杉井 学 山口大学, 国際総合科学部, 准教授 (00359910)
|
研究分担者 |
松野 浩嗣 山口大学, 大学院創成科学研究科, 教授 (10181744)
|
研究期間 (年度) |
2016-04-01 – 2020-03-31
|
研究課題ステータス |
完了 (2019年度)
|
配分額 *注記 |
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2016年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | メールフィルタ / スパムメール / 属性情報 / Jaccard係数 / 機械学習 / テキストマイニング / 単語属性 / 共出現 / メールフィルター / JACCARD係数 / 共起関係 / 共起ネットワーク / 多次元尺度法 / 語順 / 情報フィルタリング |
研究成果の概要 |
電子メール(以下メール)中の単語ではなく、その属性情報によってスパムメールを分類するメールフィルタ手法の開発が目的であった。これまでの単純な単語の出現頻度という属性に加え、品詞ごとの出現頻度や複数の単語が共出現する頻度(Jaccaard係数)、また一般的な辞書に存在しない単語のみの属性情報を用いることで、これまで以上にメール本文の特徴を捉えることができ、スパムメールを効率よく自動分類できることを明らかにした。
|
研究成果の学術的意義や社会的意義 |
これまでのメールフィルタに用いられてきたメールを特徴付ける要素は、人が見た目で容易に判断できる単語そのものであったり、単純な単語の出現頻度であった。本研究課題での成果は、メールを特徴付ける新たな単語の属性情報を発見したことや、これまで注目されていなかった一般的な辞書に存在しない単語の属性情報の重要性を明らかにしたことなどである。特に後者は、メールフィルター研究において新たな展開をもたらすことにつながり、学術的意義は大きい。また、様々なメールフィルタシステムが開発される中で進む、スパムメール流通量の増加を鑑みれば、ネットワーク資源の効率的かつ適切な利用に向けた改善策としての社会的意義は大きい。
|