• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模WWWデータからの情報資源構築のための高性能分類方式の研究

研究課題

研究課題/領域番号 18300037
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 メディア情報学・データベース
研究機関国立情報学研究所

研究代表者

大山 敬三  国立情報学研究所, コンテンツ科学研究系, 教授 (90177022)

研究分担者 高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
高久 雅生  国立情報学研究所, 情報・システム研究機構新領域融合研究センター, 融合プロジェクト研究員 (00399271)
連携研究者 高須 淳宏  国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
相澤 彰子  国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
高久 雅生  物質・材料研究機構, 科学情報室, 主任エンジニア (00399271)
研究期間 (年度) 2006 – 2008
研究課題ステータス 完了 (2008年度)
配分額 *注記
9,450千円 (直接経費: 7,800千円、間接経費: 1,650千円)
2008年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2007年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2006年度: 2,300千円 (直接経費: 2,300千円)
キーワードWebページ分類 / テキスト分類 / 機械学習 / 周辺ページ / 性能保証 / 判定コスト / 情報資源 / 情報検索
研究概要

ウェブデータから情報資源を構築する際の省力化には,ウェブページの自動分類の精度を高める必要がある。本研究では,周辺ページの内容を有効に活用して分類性能を高めるため,ウェブサイト内のリンクとディレクトリ階層に表現された潜在的意味を活用する手法,及び分類に悪影響を与える周辺ページを除去する手法を開発し,実験により有効性を確認した。本手法により,人手による確認・判定作業を大幅に削減することが可能となった。

報告書

(4件)
  • 2008 実績報告書   研究成果報告書 ( PDF )
  • 2007 実績報告書
  • 2006 実績報告書
  • 研究成果

    (23件)

すべて 2009 2008 2007 2006

すべて 雑誌論文 (15件) (うち査読あり 9件) 学会発表 (8件)

  • [雑誌論文] Web page classification based on surrounding page model representing connection type and directory hierarchy2009

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      情報処理学会論文誌データベース No.TOD-42 (印刷中)

    • 関連する報告書
      2008 研究成果報告書
    • 査読あり
  • [雑誌論文] Building web page collections efficiently exploiting local surrounding pages2009

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      Progress in Informatics No.6

      ページ: 27-39

    • NAID

      110007030564

    • 関連する報告書
      2008 研究成果報告書
    • 査読あり
  • [雑誌論文] Building web page collections efficiently exploiting local surrounding pages2009

    • 著者名/発表者名
      Yuxin WANG, Keizo OYAMA
    • 雑誌名

      Progress in Informatics No. 6

      ページ: 27-39

    • NAID

      110007030564

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] Web Page Classification based on Surrounding Page Model representing Connection Type and Directory Hierarchy2009

    • 著者名/発表者名
      Yuxin WANG, Keizo OYAMA
    • 雑誌名

      情報処理学会論文誌データベース TOD42号(印刷中)

    • 関連する報告書
      2008 実績報告書
    • 査読あり
  • [雑誌論文] 大規模データベースを利用したリンケージシステムの提案と実装2008

    • 著者名/発表者名
      相澤彰子, 高久雅生, 大山敬三
    • 雑誌名

      日本データベース学会Letters Vol.6, No.4

      ページ: 17-20

    • NAID

      40015959138

    • 関連する報告書
      2008 研究成果報告書
    • 査読あり
  • [雑誌論文] 大規模データベースを利用したリンケージシステムの提案と実装2008

    • 著者名/発表者名
      相澤彰子, 高久雅生, 大山敬三
    • 雑誌名

      日本データベース学会Letters 6(4)

      ページ: 17-20

    • NAID

      40015959138

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Framework for Building a High-Quality Web Page Collection Considering Page Group Structure2007

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      Proc. APWeb/WAIM 2007, HuangShan, China, June 16-18, 2007 LNCS 4505

      ページ: 95-107

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] A Smoothing Method for a Statistical String Similarity2007

    • 著者名/発表者名
      Atsuhiro Takasu, Kenro Aihara, Taizo Yamada
    • 雑誌名

      Proc. IEEE Intl. Conf. on Information Reuse and Integration (IRI2007)

      ページ: 67-72

    • 関連する報告書
      2007 実績報告書
    • 査読あり
  • [雑誌論文] Web Page Classification Considering Page Group Structure for Building a High-Quality Homepage Collection2007

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      Proc. 3rd International Conference on Web Information Systems and Technologies (WEBIST 2007) Vol. WIA

      ページ: 170-175

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Combining page group structure and content for roughly filtering researchers' homepages with high recall2006

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      情報処理学会論文誌データベース Vol.47, No.SIG 8

      ページ: 11-23

    • 関連する報告書
      2008 研究成果報告書
    • 査読あり
  • [雑誌論文] Combining Page Group Structure and Content for Roughly Filtering Researchers' Homepages with High Recall2006

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      情報処理学会論文誌データベース Vol.47, No.SIG 8 (TOD 30)

      ページ: 11-23

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] An Analysis on Topic Features and Difficulties based on Web Navigational Retrieval Experiments2006

    • 著者名/発表者名
      Masao Takaku, Keizo Oyama, Akiko Aizawa
    • 雑誌名

      Proc. Asia Information Retrieval Symposium (AIRS) 2006 LNCS, Vol. 4182/2006

      ページ: 625-632

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Web Page Classification Exploiting Contents of Surrounding Pages for Building a High-quality Homepage Collection2006

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 雑誌名

      Proc. 9th International Conference on Asian Digital Libraries (ICADL2006) LNCS, Vol. 4312/2006

      ページ: 515-518

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] An Approximate Multi-word Matching Algorithm for Robust Document Retrieval2006

    • 著者名/発表者名
      Atsuhiro Takasu
    • 雑誌名

      Proc. ACM Conference on Knowledge and Information Management (CIKM)

      ページ: 34-42

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Quality Enhancement in Information Extraction from Scanned Documents2006

    • 著者名/発表者名
      Atsuhiro Takasu, Kenro Aihara
    • 雑誌名

      Proc. ACM Symposium on Document Engineering (DocEng)

      ページ: 122-124

    • 関連する報告書
      2006 実績報告書
  • [学会発表] Name disambiguation of Japanese researchers: a case study with statistics research community2008

    • 著者名/発表者名
      Masao Takaku, Akiko Aizawa, Yasumasa Baba
    • 学会等名
      Joint Meeting of 4th World Conference of the IASC and 6th Conference of the Asian Regional Section of the IASC on Computational Statistics & Data Analysis (IASC2008)
    • 発表場所
      Yokohama, Japan
    • 年月日
      2008-12-05
    • 関連する報告書
      2008 研究成果報告書
  • [学会発表] Name Disambiguation of Japanese Researchers : A Case Study with Statistics Research Community2008

    • 著者名/発表者名
      Masao Takaku, Akiko Aizawa, Yasumasa Baba
    • 学会等名
      Joint Meeting of 4th World Conference of the IASC and 6^<th> Conference of the Asian Regional Section of the IASC on Computational Statistics & Data Analysis (IASC2008)
    • 発表場所
      Yokohama, Japan
    • 年月日
      2008-12-05
    • 関連する報告書
      2008 実績報告書
  • [学会発表] Web page classification exploiting surrounding pages with noisy page filtering2008

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 学会等名
      The 2008 International Conference on Data Mining (DMIN2008)
    • 発表場所
      Las Vegas, Nevada, USA
    • 年月日
      2008-07-14
    • 関連する報告書
      2008 研究成果報告書
  • [学会発表] Web Page Classification exploiting Surrounding Pages with Noisy Page Filtering2008

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 学会等名
      The 2008 International Conference on Data Mining (DMIN2008)
    • 発表場所
      Las Vegas, Nevada, USA
    • 年月日
      2008-07-14
    • 関連する報告書
      2008 実績報告書
  • [学会発表] A smoothing method for a statistical string similarity2007

    • 著者名/発表者名
      Atsuhiro Takasu, Kenro Aihara, Taizo Yamada
    • 学会等名
      IEEE Intl. Conf. on Information Reuse and Integration (IRI2007)
    • 発表場所
      Las Vegas, USA
    • 年月日
      2007-08-13
    • 関連する報告書
      2008 研究成果報告書
  • [学会発表] Framework for building a high-quality web page collection considering page group structure2007

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 学会等名
      Joint 9th Asia-Pacific Web Conference, APWeb 2007, and 8th International Conference, on Web-Age Information Management, WAIM 2007
    • 発表場所
      HuangShan, China
    • 年月日
      2007-07-16
    • 関連する報告書
      2008 研究成果報告書
  • [学会発表] Web page classification considering page group structure for building a high-quality homepage collection2007

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 学会等名
      Third International Conference on Web Information Systems and Technologies (WEBIST 2007)
    • 発表場所
      Barcelona, Spain
    • 年月日
      2007-03-03
    • 関連する報告書
      2008 研究成果報告書
  • [学会発表] Web page classification exploiting contents of surrounding pages for building a high-quality homepage collection2006

    • 著者名/発表者名
      Yuxin Wang, Keizo Oyama
    • 発表場所
      Kyoto, Japan
    • 年月日
      2006-11-27
    • 関連する報告書
      2008 研究成果報告書

URL: 

公開日: 2006-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi