• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

情報フィルタリングにおける推薦Trustに関する研究

研究課題

研究課題/領域番号 18700087
研究機関大阪大学

研究代表者

土方 嘉徳  大阪大学, 大学院基礎工学研究科, 助手 (10362641)

キーワード情報フィルタリング / 推薦Trust / アンカー関連テキスト / 文書部分 / Web / 発見性 / 協調フィルタリング / Novelty
研究概要

本研究課題は,情報推薦において信頼性または発見性の高い推薦を行うためのアルゴリズム,データ,インタフェース,社会的な枠組み,そして関連するテキスト処理技術に関する研究を行うものである.本年度は,まずWebを対象とした情報推薦において,より信頼性の高い推薦を行うために,ユーザにとって価値のある文書部分だけを抽出する方法について検討した.特にWebの特徴は,ページ同士がテキスト中に埋め込まれたアンカー(リンク)によってネットワークとして構築されている点にある.そのリンクには,作り手が重要と思う情報が埋め込んであると思われる.あるいは,読み手にとって重要である,または役に立つ情報が埋め込んであると思われる.そこで,リンクにはリンク元のWeb文書とリンク先のWeb文書の2つが関連しているが,リンク元のWeb文書の全体が必ずしもリンク先のWeb文書と意味的に関連しているわけではない.1000件のWeb文書を対象にアンカーの周辺で,どの部分がリンク先のWeb文書と意味的に関連があるかを3人の評価者を招き,調査を行った.その結果,表,段落,箇条書きなどのレイアウト上の区切りと,改行の数や他のリンクの有無などが,意味の区切りと関連があることが分かった.この調査結果から,アンカー関連テキストを上記のようなレイアウト構造だけを使って抽出するヒューリスティックスを開発し,さらに抽出結果を3人の評価者を招き,評価した.その結果,抽出精度は約95%,抽出再現率は85%となり,従来手法であるアンカーテキストだけを抽出する方法や,アンカー前後25単語を抽出する手法,段落を抽出する方法,アンカー前後の3センテンスを抽出する方法,アンカーを含むDOMオブジェクトを抽出する方法,DOM構造上上位すべてのオブジェクトを抽出する方法,Royらの提案する方法のいずれよりも,良い結果となった.

  • 研究成果

    (1件)

すべて 2006

すべて 雑誌論文 (1件)

  • [雑誌論文] Extraction of Semantic Text Portion Related to Anchor Link2006

    • 著者名/発表者名
      Bui Quang Hung, et al.
    • 雑誌名

      IEICE Transactions of Information and Systems E89-D-6

      ページ: 1834-1847

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi