迷惑メールの記述言語に依存しないフィルタリング方式の開発

研究課題

研究課題/領域番号	18500072
研究種目	基盤研究(C)
配分区分	補助金
応募区分	一般
研究分野	メディア情報学・データベース
研究機関	筑波大学
研究代表者	阪口哲男筑波大学, 大学院・図書館情報メディア研究科, 准教授 (10225790)
研究分担者	杉本重雄筑波大学, 大学院・図書館情報メディア研究科, 教授 (40154489) 永森光晴筑波大学, 大学院・システム情報工学研究科, 講師 (60272209)
研究期間 (年度)	2006 – 2007
研究課題ステータス	完了 (2007年度)
配分額 *注記	2,870千円 (直接経費: 2,600千円、間接経費: 270千円) 2007年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2006年度: 1,700千円 (直接経費: 1,700千円)
キーワード	電子メール / spam / 多言語テキスト処理 / 自動分類 / 迷惑メール / Unicode / 多言語処理
研究概要	近年、インターネットの電子メールでは受信者が求めていないメッセージを多量に送りつける、いわゆる迷惑メール(spam, UBE)の増加が問題となっている。この対策の一種として、メッセージの特徴に基づく学習型の自動分類手法を用い、利用者が迷惑メールを選別する手間を減らす方式がある。しかしながら、その特徴量の抽出には主に自然言語処理の形態素解析手法が用いられているため、英語を始めとする特定の言語には対応しているが、それ以外の言語で書かれた迷惑メールの選別精度に問題が残る。本研究はこのような状況において、特定の言語向けの形態素解析手法によらず、電子メールにおけるメッセージからの特徴量抽出手法を検討し、その評価を行うことによって、メッセージを記述している言語に依存しない迷惑メールフィルタリングの手法の開発を進めるものである。メールから抽出する特徴量としで「語」に代わるものに基づくことにより言語に依存しないフィルタリング方式の確立を目指す。平成18年度までに単純に一定の長さの部分文字列を切り出す手法の開発とその評価を進めてきた。しかしながら固定長による方式では一単語あたりの文字列長が長くなる表音文字が主であるメールについての精度に問題がある。そこで、平成19年度はUnicodeの文字分類や文字属性を利用した可変長切り出し手法の開発を行った。そしてコーパスによる実験を通じてその精度の改善を確認した。しかしながら、残された課題として評価実験に用いるコーパス構築における非迷惑メールの収集があり、今後様々な迷惑メール対策手法の開発共通の問題となりつつあることがわかった。

報告書

(3件)

2007 実績報告書研究成果報告書概要
2006 実績報告書

研究成果
(3件)

すべて 2008

すべて雑誌論文 (3件) (うち査読あり 2件)

[雑誌論文] 分割・統合可能な組織内 Web アーカイブシステムの構成方法2008
- 著者名/発表者名
  柊和佑・阪口哲男・杉本重雄
- 雑誌名
  
  情報知識学会誌 Vol.18,No.1
  
  ページ: 47-57
- NAID
  110006647782
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2007 研究成果報告書概要
- 査読あり
[雑誌論文] An Archiecture of Institutional Web Archiving System that hava functions to Merge and Split Archives2008
- 著者名/発表者名
  Wasuke Hiiragi, Tetsuo Sakaguchi, Shigeo Sugimoto
- 雑誌名
  
  Journal of Japan Society of Information and Knowledge 18-1
  
  ページ: 47-57
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2007 研究成果報告書概要
[雑誌論文] 分割・統合可能な組織内Webアーカイブシステムの構成方法2008
- 著者名/発表者名
  柊和佑, 阪口哲男, 杉本重雄
- 雑誌名
  
  情報知識学会誌 Vol.18, No.1
  
  ページ: 47-57
- NAID
  110006647782
- 関連する報告書
  2007 実績報告書
- 査読あり

迷惑メールの記述言語に依存しないフィルタリング方式の開発

研究代表者

阪口 哲男 筑波大学, 大学院・図書館情報メディア研究科, 准教授 (10225790)

2,870千円 (直接経費: 2,600千円、間接経費: 270千円)

報告書

研究成果

[雑誌論文] 分割・統合可能な組織内 Web アーカイブシステムの構成方法2008

著者名/発表者名

雑誌名

NAID

説明

関連する報告書

[雑誌論文] An Archiecture of Institutional Web Archiving System that hava functions to Merge and Split Archives2008

著者名/発表者名

雑誌名

説明

関連する報告書

[雑誌論文] 分割・統合可能な組織内Webアーカイブシステムの構成方法2008

著者名/発表者名

雑誌名

NAID

関連する報告書

阪口哲男筑波大学, 大学院・図書館情報メディア研究科, 准教授 (10225790)