スパムブログ空間の定量分析とフィルタリング手法の開発

研究課題

研究課題/領域番号	20700127
研究種目	若手研究(B)
配分区分	補助金
研究分野	知能情報学
研究機関	東京大学
研究代表者	福原知宏東京大学, 人工物工学研究センター, 特任助教 (50436581)
研究期間 (年度)	2008 – 2009
研究課題ステータス	完了 (2009年度)
配分額 *注記	2,080千円 (直接経費: 1,600千円、間接経費: 480千円) 2009年度: 130千円 (直接経費: 100千円、間接経費: 30千円) 2008年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワード	スパムフィルタリング / スパムブログ / 個人適応 / スパムプログ(Splog) / Splogデータセット / Splogフィルタリング
研究概要	本研究ではWeb上のスパムブログ(splog)空間の定量分析に基づき,効率的にsplogをフィルタリングする手法の開発と評価を行った.日本語,中国語,英語,韓国語のsplogを収集し,正解データ集合を作成した.正解データ集合を分析した結果,splog判定に個人差が見られることを確認した.機械学習を用いて各個人のsplog判定傾向を学習し,各個人に対して最適なsplogフィルタを提供するシステムの開発と評価を行った.日本語splog正解データ集合を用いて評価を行った結果,従来手法に比べ性能改善が可能であることを確認した.

報告書

(3件)

2009 実績報告書研究成果報告書 ( PDF )
2008 実績報告書

研究成果
(27件)

すべて 2010 2009 2008

すべて学会発表 (26件) 図書 (1件)

[学会発表] 機械学習を用いた個人適応型splogフィルタリングの開発2010
- 著者名/発表者名
  芳中隆幸, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  日本データベース学会第2回データ工学と情報マネジメントに関するフォーラム
- 発表場所
  淡路夢舞台国際会議場(兵庫県)
- 年月日
  2010-03-02
- 関連する報告書
  2009 研究成果報告書
[学会発表] 機械学習を用いた個人適応型Splogフィルタリングの開発2010
- 著者名/発表者名
  芳中隆幸, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  日本データベース学会第2回データ工学と情報マネジメントに関するフォーラム
- 発表場所
  淡路夢舞台国際会議場(兵庫県)
- 年月日
  2010-03-02
- 関連する報告書
  2009 実績報告書
[学会発表] ブログ上の広告活動を対象としたアフィリエイト分析支援システム2010
- 著者名/発表者名
  石井聡一, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  日本データベース学会第2回データ工学と情報マネジメントに関するフォーラム
- 発表場所
  淡路夢舞台国際会議場(兵庫県)
- 年月日
  2010-03-01
- 関連する報告書
  2009 実績報告書 2009 研究成果報告書
[学会発表] HTML構造を利用した類似スパムブログの収集2010
- 著者名/発表者名
  片山太一, 芳中隆幸, 宇津呂武仁, 河田容英, 福原知宏
- 学会等名
  日本データベース学会第2回データ工学と情報マネジメントに関するフォーラム
- 発表場所
  淡路夢舞台国際会議場(兵庫県)
- 年月日
  2010-03-01
- 関連する報告書
  2009 実績報告書
[学会発表] 個人適応型splogフィルタリングシステムの実現に向けて: splog判定データセットの構築と機械学習を用いたシステムの実装2010
- 著者名/発表者名
  芳中隆幸, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  電子情報通信学会言語理解とコミュニケーション研究会第1回集合知シンポジウム
- 発表場所
  広島市まちづくり市民交流プラザ(広島県)
- 年月日
  2010-01-25
- 関連する報告書
  2009 研究成果報告書
[学会発表] 個人適応型Splogフィルタリングシステムの実現に向けて:Splog判定データセットの構築と機械学習を用いたシステムの実装2010
- 著者名/発表者名
  芳中隆幸, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  電子情報通信学会言語理解とコミュニケーション研究会第1回集合知シンポジウム
- 発表場所
  広島市まちづくり市民交流プラザ(広島県)
- 年月日
  2010-01-25
- 関連する報告書
  2009 実績報告書
[学会発表] Detecting splogs using Similarities of splog HTML Structures2010
- 著者名/発表者名
  Katayama, T., Yoshinaka, T., Utsuro, T., Kawada, Y., Fukuhara, T.
- 学会等名
  The 4th International Conference on Ubiquitous Information Management and Communication
- 発表場所
  Suwon (Korea)
- 年月日
  2010-01-14
- 関連する報告書
  2009 研究成果報告書
[学会発表] Detecting Splogs using Similarities of Splog HTML Structures2010
- 著者名/発表者名
  片山太一, 芳中隆幸, 宇津呂武仁, 河田容英, 福原知宏
- 学会等名
  The 4th International Conference on Ubiquitous Information Management and Communication
- 発表場所
  スウォン(韓国)
- 年月日
  2010-01-14
- 関連する報告書
  2009 実績報告書
[学会発表] ブログ上の広告活動を対象としたアフィリエイト分析支援システム2009
- 著者名/発表者名
  石井聡一, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  日本データベース学会第2回データ工学と情報マネジメントに関するフォーラム
- 発表場所
  慶應義塾大学日吉キャンパス(神奈川県)
- 年月日
  2009-11-21
- 関連する報告書
  2009 研究成果報告書
[学会発表] スプログ検出におけるHTML構造の類似性の有効性の評価2009
- 著者名/発表者名
  片山太一, 芳中隆幸, 宇津呂武仁, 河田容英, 福原知宏
- 学会等名
  情報処理学会第149回データベースシステム研究発表会
- 発表場所
  慶應義塾大学日吉キャンパス(神奈川県)
- 年月日
  2009-11-21
- 関連する報告書
  2009 実績報告書
[学会発表] Web上の広告情報を用いたアフィリエイトスパムの分析2009
- 著者名/発表者名
  石井聡一, 芳中隆幸, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  楽天研究開発シンポジウム2009
- 発表場所
  品川シーサイド楽天タワー(東京都)
- 年月日
  2009-11-14
- 関連する報告書
  2009 実績報告書 2009 研究成果報告書
[学会発表] HTML構造の類似性を利用したスプログ検出方式2009
- 著者名/発表者名
  片山太一, 宇津呂武仁, 芳中隆幸, 河田容英, 福原知宏
- 学会等名
  言語処理学会NLP若手の会第4回シンポジウム
- 発表場所
  京都大学百周年時計台記念館(京都府)
- 年月日
  2009-10-01
- 関連する報告書
  2009 実績報告書 2009 研究成果報告書
[学会発表] A User-Oriented splog Filtering Based on Machine Learning2009
- 著者名/発表者名
  Yoshinaka, T., Ishii, S., Fukuhara, T., Masuda, H., Nakagawa, H.
- 学会等名
  The 6th International Conference on Social Software
- 発表場所
  Jeju (Korea)
- 年月日
  2009-09-15
- 関連する報告書
  2009 研究成果報告書
[学会発表] A User-Oriented Splog Filtering Based on Machine Learning2009
- 著者名/発表者名
  芳中隆幸, 石井聡一, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  The 6th International Conference on Social Software(BlogTalk 2009)
- 発表場所
  済州島(韓国)
- 年月日
  2009-09-15
- 関連する報告書
  2009 実績報告書
[学会発表] Web上の広告活動の分析2009
- 著者名/発表者名
  石井聡一, 芳中隆幸, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  第23回人工知能学会全国大会
- 発表場所
  サンポートホール高松(香川県)
- 年月日
  2009-06-19
- 関連する報告書
  2009 実績報告書 2009 研究成果報告書
[学会発表] 機械学習を用いたユーザ適応型splogフィルタリングシステムの開発2009
- 著者名/発表者名
  芳中隆幸, 石井聡一, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  第23回人工知能学会全国大会
- 発表場所
  サンポートホール高松(香川県)
- 年月日
  2009-06-18
- 関連する報告書
  2009 研究成果報告書
[学会発表] 機械学習を用いたユーザ適応型Splogフィルタリングシステムの開発2009
- 著者名/発表者名
  芳中隆幸, 石井聡一, 福原知宏, 増田英孝, 中川裕志
- 学会等名
  第23回人工知能学会全国大会
- 発表場所
  サンポートホール高松(香川県)
- 年月日
  2009-06-18
- 関連する報告書
  2009 実績報告書
[学会発表] An Empirical Study on Selective Sampling in Active Learning for splog Detection2009
- 著者名/発表者名
  Katayama, T., Utsuro, T., Sato, Y., Yoshinaka, T., Kawada, Y., Fukuhara, T.
- 学会等名
  The 5th International Workshop on Adversarial information Retrieval on the Web
- 発表場所
  Madrid (Spain)
- 年月日
  2009-04-21
- 関連する報告書
  2009 研究成果報告書
[学会発表] An Empirical Study on Selective Sampling in Active Learning for Splog Detection2009
- 著者名/発表者名
  Taichi Katayama, Takeshi Utsuro, Yuuki Sato, Takayuki Yoshinaka, Yasuhide Kawada, Tomohiro Fukuhara
- 学会等名
  The 5th International Workshop on Adversarial information Retrieval on the Web
- 発表場所
  マドリッド(スペイン)
- 年月日
  2009-04-21
- 関連する報告書
  2009 実績報告書
[学会発表] 機械学習を用いたスパムプログ検出における信頼度の利用2009
- 著者名/発表者名
  片山太一
- 学会等名
  第1回データ工学と情報マネジメントに関するフォーラム(DEIM2009)
- 発表場所
  ヤマハリゾートつま恋(静岡県掛川市)
- 年月日
  2009-03-10
- 関連する報告書
  2008 実績報告書
[学会発表] プログ空間におけるスパムサイト解析ツールの開発 : ユーザ適応型Splogフィルタリングに向けて2009
- 著者名/発表者名
  芳中隆幸
- 学会等名
  2009年暗号と情報セキュリティシンポジウム(SGIS2009)
- 発表場所
  大津プリンスホテル-(滋賀県草津市)
- 年月日
  2009-01-20
- 関連する報告書
  2008 実績報告書
[学会発表] ユーザ適応型Splogフィルタリングのためのユーザ固有Splog空間の分析2008
- 著者名/発表者名
  芳中隆幸
- 学会等名
  Webとデータベースに関するフォーラム(WebDB Forum2008)
- 発表場所
  学習院創立百周年記念会館(東京都)
- 年月日
  2008-12-01
- 関連する報告書
  2008 実績報告書
[学会発表] 実験的評価に基づくユーザ固有Splog空間の検証 : ユーザ適応型Splogフィルタリングに向けて2008
- 著者名/発表者名
  芳中隆幸
- 学会等名
  第7回情報科学技術フォーラム(FIT2008)
- 発表場所
  慶應義塾大学湘南藤沢キャンパス(神奈川県藤沢市)
- 年月日
  2008-09-02
- 関連する報告書
  2008 実績報告書
[学会発表] ユーザ適応型Splogフィルタリング向けたSplog空間調査ツールの開発と評価実験2008
- 著者名/発表者名
  芳中隆幸
- 学会等名
  第12回Webインテリジェンスとインタラクション(W12)研究会
- 発表場所
  淡路島淡路夢舞台国際会議場(兵庫県淡路市)
- 年月日
  2008-07-19
- 関連する報告書
  2008 実績報告書
[学会発表] Splog空間における定量的調査支援システムの開発とその評価2008
- 著者名/発表者名
  芳中隆幸
- 学会等名
  第22回人工知能学会全国大会(JSAI2008)
- 発表場所
  ときわ市民ホール/勤労者福祉総合センター(北海道旭川市)
- 年月日
  2008-06-11
- 関連する報告書
  2008 実績報告書
[学会発表] Analysing Features of Japanese Splogs and Characteristics of Keywords2008
- 著者名/発表者名
  Yuki Sato
- 学会等名
  WWW2008 workshop : Fourth International Nor kshop on Adversarial Information Retrieval on the Web (AIRWeb2008)
- 発表場所
  Beijing, China
- 年月日
  2008-04-22
- 関連する報告書
  2008 実績報告書
[図書] Proceedings of the 6th International Conference on Social Software (BlogTalk2009) (Title: A User-Oriented Splog Filtering Based on Machine Learning)2009
- 著者名/発表者名
  Yoshinaka, T., Ishii, S., Fukuhara, T., Masuda, H., Nakagawa, H.
- 出版者
  Springer(in printing)
- 関連する報告書
  2009 研究成果報告書

スパムブログ空間の定量分析とフィルタリング手法の開発

研究代表者

福原 知宏 東京大学, 人工物工学研究センター, 特任助教 (50436581)

2,080千円 (直接経費: 1,600千円、間接経費: 480千円)

報告書

研究成果

[学会発表] 機械学習を用いた個人適応型splogフィルタリングの開発2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 機械学習を用いた個人適応型Splogフィルタリングの開発2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] ブログ上の広告活動を対象としたアフィリエイト分析支援システム2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] HTML構造を利用した類似スパムブログの収集2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 個人適応型splogフィルタリングシステムの実現に向けて: splog判定データセットの構築と機械学習を用いたシステムの実装2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] 個人適応型Splogフィルタリングシステムの実現に向けて:Splog判定データセットの構築と機械学習を用いたシステムの実装2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Detecting splogs using Similarities of splog HTML Structures2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Detecting Splogs using Similarities of Splog HTML Structures2010

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] ブログ上の広告活動を対象としたアフィリエイト分析支援システム2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] スプログ検出におけるHTML構造の類似性の有効性の評価2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Web上の広告情報を用いたアフィリエイトスパムの分析2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] HTML構造の類似性を利用したスプログ検出方式2009

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] A User-Oriented splog Filtering Based on Machine Learning2009

著者名/発表者名

福原知宏東京大学, 人工物工学研究センター, 特任助教 (50436581)