研究課題/領域番号 |
18300037
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
メディア情報学・データベース
|
研究機関 | 国立情報学研究所 |
研究代表者 |
大山 敬三 国立情報学研究所, コンテンツ科学研究系, 教授 (90177022)
|
研究分担者 |
高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
高久 雅生 国立情報学研究所, 情報・システム研究機構新領域融合研究センター, 融合プロジェクト研究員 (00399271)
|
連携研究者 |
高須 淳宏 国立情報学研究所, コンテンツ科学研究系, 教授 (90216648)
相澤 彰子 国立情報学研究所, コンテンツ科学研究系, 教授 (90222447)
高久 雅生 物質・材料研究機構, 科学情報室, 主任エンジニア (00399271)
|
研究期間 (年度) |
2006 – 2008
|
研究課題ステータス |
完了 (2008年度)
|
配分額 *注記 |
9,450千円 (直接経費: 7,800千円、間接経費: 1,650千円)
2008年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2007年度: 3,770千円 (直接経費: 2,900千円、間接経費: 870千円)
2006年度: 2,300千円 (直接経費: 2,300千円)
|
キーワード | Webページ分類 / テキスト分類 / 機械学習 / 周辺ページ / 性能保証 / 判定コスト / 情報資源 / 情報検索 |
研究概要 |
ウェブデータから情報資源を構築する際の省力化には,ウェブページの自動分類の精度を高める必要がある。本研究では,周辺ページの内容を有効に活用して分類性能を高めるため,ウェブサイト内のリンクとディレクトリ階層に表現された潜在的意味を活用する手法,及び分類に悪影響を与える周辺ページを除去する手法を開発し,実験により有効性を確認した。本手法により,人手による確認・判定作業を大幅に削減することが可能となった。
|