• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

参照の同一性判定に基づく複数Webページの検索閲覧方式の研究

Research Project

Project/Area Number 16700097
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Media informatics/Database
Research InstitutionKyoto University

Principal Investigator

小山 聡  京都大学, 情報学研究科, 助手 (30346100)

Project Period (FY) 2004 – 2006
Project Status Completed (Fiscal Year 2006)
Budget Amount *help
¥3,600,000 (Direct Cost: ¥3,600,000)
Fiscal Year 2006: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2005: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2004: ¥1,600,000 (Direct Cost: ¥1,600,000)
KeywordsWeb検索 / オブジェクト識別 / クラスタリング / 機械学習 / 情報抽出 / 情報統合 / Webマイニング / Web閲覧インタフェース / 文書構造 / 類似度 / 文脈依存検索 / カーネル法 / 共参照解決 / オブジェクト同定 / 類似度の学習 / 質問修正 / Web閲覧インターフェース
Research Abstract

オブジェクト識別は,文書集合等に現れる人名や店舗名などが実世界の同じオブジェクトを指しているか否かを判別する問題であり,通常,対象の名前を含む文書を,それらの間の類似度や距離に基づいてクラスタリングすることで解決される.しかしながら,目的に合致した適切な類似度や距離を用いなければ,望ましいクラスタリング結果を得ることはできない.従来,人手でラベル付けされた例題から,類似度や距離を学習させる研究が行われてきたが,人的なコストが掛かるという問題があった.我々は,オブジェクト識別を行う際にクラスタリングで用いる距離を,人間の教師を必要とせずに学習させる手法を提案した.提案手法は,別名の別オブジェクトへの対応と名前の恣意性という2つの仮定に基づいている.これらの2つの仮定が成り立てば,異なる名前を含むデータ対をリンク不可な例題として学習した距離を,同じ名前を持つデータのオブジェクト識別に用いることができるため,訓練集合の人手での作成が不要になる.リンク不可なデータ対のみを例題として用いる距離の学習は,凸2次計画問題として定式化され,一般の距離行列を学習する際に必要な半正定値計画問題よりも,高速に解くことが可能である.また,オブジェクトに関する情報を複数ページから抽出し統合する例として,対象となる人物の経歴情報をWeb検索結果中から収集する手法の研究を行った.さらに,複数Webページの検索閲覧を支援するために,ユーザが与えた語と兄弟関係にある語を発見する手法,およびユーザが与えたWebページの話題と兄弟カテゴリに属する話題を記述したページを発見する手法を開発した.そして,目的のオブジェクトに関するページを効率良く取得するため,話題語をノードとするグラフでWebページ集合を表現し,グラフを操作させることでユーザからのフィードバックを得るユーザインタフェースの研究を行った.

Report

(3 results)
  • 2006 Annual Research Report
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • Research Products

    (19 results)

All 2007 2006 2005 2004

All Journal Article (19 results)

  • [Journal Article] 文書群を問合せとした兄弟カテゴリ文書の検索2007

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会論文誌 J90-D(2)

      Pages: 196-208

    • NAID

      110007380653

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Web検索結果におけるキーワード出現相関の可視化と対話的な質問変換2007

    • Author(s)
      吉田 大我, 小山 聡, 中村 聡史, 田中 克己
    • Journal Title

      電子情報通信学会第18回データエ学ワークショップ(DEWS 2007)論文集

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Learning a Distance Metric for Object Identification without Human Supervision2006

    • Author(s)
      Satoshi Oyama, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Artificial Intelligence (Proceedings of PKDD 2006) 4213

      Pages: 609-616

    • NAID

      110004744917

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Searching Coordinate Terms with their Context from the Web2006

    • Author(s)
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Computer Science (Proceedings of WISE 2006) 4255

      Pages: 40-47

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Sibling Page Search by Page Examples2006

    • Author(s)
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Computer Science (Proceedings of ICADL2006) 4312

      Pages: 91-100

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 文書群をクエリとした似て非なる文書の検索2006

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      日本データベース学会Letters 5(1)

      Pages: 121-124

    • NAID

      40015217346

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Webからの人物事典生成のための経歴情報の自動収集2006

    • Author(s)
      木村 塁, 小山 聡, 田中 克己
    • Journal Title

      日本データベース学会Letters 5(2)

      Pages: 29-32

    • NAID

      40015217365

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Web検索エンジンのインデックスを用いた同位語とそのコンテキストの発見2006

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      情報処理学会論文誌 : データベース 47(SIG19)(TOD32)

      Pages: 98-112

    • NAID

      110006160105

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Context Matcher : Improved Web Search Using Query Term Context in Source Document and in Search Results2006

    • Author(s)
      Takahiro Kawashige, Satoshi Oyama, Hiroaki Ohshima, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Computer Science (Proceedings of the 8th Asia Pacific Web Conference (APWeb2006)) Vol.3841

      Pages: 486-497

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Webの構造情報とプロファイル抽出を用いたオブジェクト識別2006

    • Author(s)
      白砂 健一, 小山 聡, 田島 敬史, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • Related Report
      2005 Annual Research Report
  • [Journal Article] レビューページ例からの属性抽出に基づくレビューページ検索2006

    • Author(s)
      赤木 法生, 大島 裕明, 小山 聡, 田島 敬史, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 質問修正と再ランキングを用いた文脈依存Web検索2006

    • Author(s)
      河重 貴洋, 小山 聡, 大島 裕明, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 複数Webサイトからの共通側面の抽出と類似サイト検索2006

    • Author(s)
      小谷 彬, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 文書群をクエリとした似て非なる文書の検索2006

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • NAID

      40015217346

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 複数Webコンテンツの多面的閲覧のための空間インタフェース2005

    • Author(s)
      小谷 彬, 小山 聡, 田中 克己
    • Journal Title

      日本データベース学会Letters Vol.4,No.1

      Pages: 161-164

    • NAID

      40007013168

    • Related Report
      2005 Annual Research Report
  • [Journal Article] 異なる例からの素性の組合せを用いたペアワイズ分類器の学習2005

    • Author(s)
      小山 聡, クリストファー D.マニング
    • Journal Title

      人工知能学会論文誌 Vol.20, No.2

      Pages: 105-116

    • NAID

      10022004970

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 検索語の閲覧文書と検索結果における文脈を利用した質問修正2005

    • Author(s)
      河重 貴洋, 大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005)論文集

    • Related Report
      2004 Annual Research Report
  • [Journal Article] 複数Webコンテンツの多面的閲覧のための空間インタフェース2005

    • Author(s)
      小谷 彬, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005)論文集

    • NAID

      40007013168

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Using Feature Conjunctions across Examples for Learning Pairwise Classifiers2004

    • Author(s)
      Satoshi Oyama, Christnpher D Manning
    • Journal Title

      Lecture Notes in Artificial Intelligence (Proceedings of the 15th European Conference on Machine Learning (ECML2004)) Vol.3201

      Pages: 322-333

    • NAID

      10022004970

    • Related Report
      2004 Annual Research Report

URL: 

Published: 2004-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi