Study on High Performance Classification Method for Constructing Information Resources from Large Scale WWW Data
Project/Area Number |
18300037
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Research Field |
Media informatics/Database
|
Research Institution | National Institute of Informatics |
Principal Investigator |
OYAMA Keizo National Institute of Informatics, コンテンツ科学研究系, 教授 (90177022)
|
Co-Investigator(Kenkyū-buntansha) |
高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
高久 雅生 国立情報学研究所, 情報・システム研究機構新領域融合研究センター, 融合プロジェクト研究員 (00399271)
|
Co-Investigator(Renkei-kenkyūsha) |
TAKASU Atsuhiro 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
AIZAWA Akiko 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
TAKAKU Masao 物質・材料研究機構, 科学情報室, 主任エンジニア (00399271)
|
Project Period (FY) |
2006 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥9,450,000 (Direct Cost: ¥7,800,000、Indirect Cost: ¥1,650,000)
Fiscal Year 2008: ¥3,380,000 (Direct Cost: ¥2,600,000、Indirect Cost: ¥780,000)
Fiscal Year 2007: ¥3,770,000 (Direct Cost: ¥2,900,000、Indirect Cost: ¥870,000)
Fiscal Year 2006: ¥2,300,000 (Direct Cost: ¥2,300,000)
|
Keywords | Webページ分類 / テキスト分類 / 機械学習 / 周辺ページ / 性能保証 / 判定コスト / 情報資源 / 情報検索 |
Research Abstract |
ウェブデータから情報資源を構築する際の省力化には,ウェブページの自動分類の精度を高める必要がある。本研究では,周辺ページの内容を有効に活用して分類性能を高めるため,ウェブサイト内のリンクとディレクトリ階層に表現された潜在的意味を活用する手法,及び分類に悪影響を与える周辺ページを除去する手法を開発し,実験により有効性を確認した。本手法により,人手による確認・判定作業を大幅に削減することが可能となった。
|
Report
(4 results)
Research Products
(23 results)