2004 年度実績報告書

近似文字列照合アルゴリズムを用いたウェブマイニング手法の研究

研究課題

研究課題/領域番号	16700106
研究機関	九州大学
研究代表者	中藤哲也九州大学, 情報基盤センター, 助手 (20253502)
キーワード	Web Mining / ウェブマイニング / Wrapper Generation / ラッパー生成 / Search Engine / 検索エンジン / Deep Web / FFT(fast Fourier transform)
研究概要	我々が提案している近似文字列照合問題を高速に解く確率アルゴリズム("An Efficient Mapping for Score of String Matching"[PSC'03])を実計算機上に実装し,理論通り働くことを確認した.加えて,このアルゴリズムを応用した繰り返しパターン発見アルゴリズムを実装した.これにより,"FFTを用いた繰り返しパターン発見手法の提案"[DBWS2003]で示したアルゴリズムを,より効率的に実行することが可能となった. 本アルゴリズムの応用として,WebデータベースのWebサービス化を取り上げた.本アルゴリズムを用いてWebデータベースの出力結果に対するラッパー生成を行なうと同時に,入力フィールドの解析やサービス連携のための仕組みの提案を行なった.ラッパー生成については,評価のために必要なテストベッドを準備し(Yamada et al.,"Testbed for Information Extraction from Deep Web"[WWW04,pp.346-347]),それを用いた客観的な評価を行なっている("Automatic Generation of Deep Web Wrappers based on Discovery of Repetition"[AIRS2004,pp269-272]).

研究成果
(6件)

すべて 2004

すべて雑誌論文 (6件)

[雑誌論文] Testbed for Information Extraction from Deep Web.2004
- 著者名/発表者名
  Yasuhiro Yamada
- 雑誌名
  
  Proc.of the 13th International World Wide Web Conference
  
  ページ: 346-347
[雑誌論文] 検索サイトにおける入力項目と検索結果のフィールド名の対応調査2004
- 著者名/発表者名
  大森敬介
- 雑誌名
  
  第3回情報科学技術フォーラム(FIT2004)
  
  ページ: 89-90
[雑誌論文] Automatic Generation of Deep Web Wrappers based on Discovery of Repetition.2004
- 著者名/発表者名
  Tetsuya Nakatoh
- 雑誌名
  
  Proc.of the First Asia Information Retrieval Symposium
  
  ページ: 269-272
[雑誌論文] 検索エンジンを部品とするエージェントの構成について2004
- 著者名/発表者名
  中藤哲也
- 雑誌名
  
  Proc.of JAWS2004 (Joint Agent Workshops & Symposium)
  
  ページ: 441-445
[雑誌論文] A Report on Metadata for Web Databases.2004
- 著者名/発表者名
  Tetsuya Nakatoh
- 雑誌名
  
  情報処理学会研究報告(IPSJ SIG Technical Reports) ICS-138
  
  ページ: 95-98
[雑誌論文] 複雑な検索サイトにおける入力フォーム情報の自動抽出2004
- 著者名/発表者名
  大森敬介
- 雑誌名
  
  Data Engineering WorkShop (DEWS2005)
  
  ページ: 4B-i12

2004 年度 実績報告書

近似文字列照合アルゴリズムを用いたウェブマイニング手法の研究

研究代表者

中藤 哲也 九州大学, 情報基盤センター, 助手 (20253502)

研究成果

[雑誌論文] Testbed for Information Extraction from Deep Web.2004

著者名/発表者名

雑誌名

[雑誌論文] 検索サイトにおける入力項目と検索結果のフィールド名の対応調査2004

著者名/発表者名

雑誌名

[雑誌論文] Automatic Generation of Deep Web Wrappers based on Discovery of Repetition.2004

著者名/発表者名

雑誌名

[雑誌論文] 検索エンジンを部品とするエージェントの構成について2004

著者名/発表者名

雑誌名

[雑誌論文] A Report on Metadata for Web Databases.2004

著者名/発表者名

雑誌名

[雑誌論文] 複雑な検索サイトにおける入力フォーム情報の自動抽出2004

著者名/発表者名

雑誌名

2004 年度実績報告書

中藤哲也九州大学, 情報基盤センター, 助手 (20253502)