大規模WWWデータからの情報資源構築のための高性能分類方式の研究

Study on High Performance Classification Method for Constructing Information Resources from Large Scale WWW Data

Research Project Number:18300037

Principal Investigator

  • FY2006 - FY2008

    • 大山 敬三
    • OYAMA, Keizo
    • Researcher Number:90177022
    • 国立情報学研究所・コンテンツ科学研究系・教授

Members

Co-Investigators

    • 高須 淳宏
    • Researcher Number:90216648
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 相澤 彰子
    • Researcher Number:90222447
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 高久 雅生
    • Researcher Number:00399271
    • 国立情報学研究所・情報・システム研究機構新領域融合研究センター・融合プロジェクト研究員

Research Partners

    • 高須 淳宏
    • TAKASU, Atsuhiro
    • Researcher Number:90216648
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 相澤 彰子
    • AIZAWA, Akiko
    • Researcher Number:90222447
    • 国立情報学研究所・コンテンツ科学研究系・教授
    • 高久 雅生
    • TAKAKU, Masao
    • Researcher Number:00399271
    • 物質・材料研究機構・科学情報室・主任エンジニア


Basic Information of this Research Project(Latest year)

  • Project Year

    FY2006〜FY2008

  • Research Field

    メディア情報学・データベース

  • Screaning Classification

    一般

  • Research Category

    基盤研究(B)

  • Research Institution

    国立情報学研究所

  • Budget Amount

    • Total:¥9450000
    • FY2006:¥2300000 (Direct:¥2300000)
    • FY2007:¥3770000 (Direct:¥2900000, Indirect:¥870000)
    • FY2008:¥3380000 (Direct:¥2600000, Indirect:¥780000)

Abstract(Latest report)

ウェブデータから情報資源を構築する際の省力化には,ウェブページの自動分類の精度を高める必要がある。本研究では,周辺ページの内容を有効に活用して分類性能を高めるため,ウェブサイト内のリンクとディレクトリ階層に表現された潜在的意味を活用する手法,及び分類に悪影響を与える周辺ページを除去する手法を開発し,実験により有効性を確認した。本手法により,人手による確認・判定作業を大幅に削減することが可能となった。

URI of this page

http://kaken.nii.ac.jp/en/p/18300037