• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2006 Fiscal Year Annual Research Report

参照の同一性判定に基づく複数Webページの検索閲覧方式の研究

Research Project

Project/Area Number 16700097
Research InstitutionKyoto University

Principal Investigator

小山 聡  京都大学, 情報学研究科, 助手 (30346100)

KeywordsWeb検索 / オブジェクト識別 / クラスタリング / 機械学習 / 情報抽出 / 情報統合 / Webマイニング / Web閲覧インタフェース
Research Abstract

オブジェクト識別は,文書集合等に現れる人名や店舗名などが実世界の同じオブジェクトを指しているか否かを判別する問題であり,通常,対象の名前を含む文書を,それらの間の類似度や距離に基づいてクラスタリングすることで解決される.しかしながら,目的に合致した適切な類似度や距離を用いなければ,望ましいクラスタリング結果を得ることはできない.従来,人手でラベル付けされた例題から,類似度や距離を学習させる研究が行われてきたが,人的なコストが掛かるという問題があった.我々は,オブジェクト識別を行う際にクラスタリングで用いる距離を,人間の教師を必要とせずに学習させる手法を提案した.提案手法は,別名の別オブジェクトへの対応と名前の恣意性という2つの仮定に基づいている.これらの2つの仮定が成り立てば,異なる名前を含むデータ対をリンク不可な例題として学習した距離を,同じ名前を持つデータのオブジェクト識別に用いることができるため,訓練集合の人手での作成が不要になる.リンク不可なデータ対のみを例題として用いる距離の学習は,凸2次計画問題として定式化され,一般の距離行列を学習する際に必要な半正定値計画問題よりも,高速に解くことが可能である.また,オブジェクトに関する情報を複数ページから抽出し統合する例として,対象となる人物の経歴情報をWeb検索結果中から収集する手法の研究を行った.さらに,複数Webページの検索閲覧を支援するために,ユーザが与えた語と兄弟関係にある語を発見する手法,およびユーザが与えたWebページの話題と兄弟カテゴリに属する話題を記述したページを発見する手法を開発した.そして,目的のオブジェクトに関するページを効率良く取得するため,話題語をノードとするグラフでWebページ集合を表現し,グラフを操作させることでユーザからのフィードバックを得るユーザインタフェースの研究を行った.

  • Research Products

    (8 results)

All 2007 2006

All Journal Article (8 results)

  • [Journal Article] 文書群を問合せとした兄弟カテゴリ文書の検索2007

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      電子情報通信学会論文誌 J90-D(2)

      Pages: 196-208

  • [Journal Article] Web検索結果におけるキーワード出現相関の可視化と対話的な質問変換2007

    • Author(s)
      吉田 大我, 小山 聡, 中村 聡史, 田中 克己
    • Journal Title

      電子情報通信学会第18回データエ学ワークショップ(DEWS 2007)論文集

      Pages: C7-2

  • [Journal Article] Learning a Distance Metric for Object Identification without Human Supervision2006

    • Author(s)
      Satoshi Oyama, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Artificial Intelligence (Proceedings of PKDD 2006) 4213

      Pages: 609-616

  • [Journal Article] Searching Coordinate Terms with their Context from the Web2006

    • Author(s)
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Computer Science (Proceedings of WISE 2006) 4255

      Pages: 40-47

  • [Journal Article] Sibling Page Search by Page Examples2006

    • Author(s)
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • Journal Title

      Lecture Notes in Computer Science (Proceedings of ICADL2006) 4312

      Pages: 91-100

  • [Journal Article] 文書群をクエリとした似て非なる文書の検索2006

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      日本データベース学会Letters 5(1)

      Pages: 121-124

  • [Journal Article] Webからの人物事典生成のための経歴情報の自動収集2006

    • Author(s)
      木村 塁, 小山 聡, 田中 克己
    • Journal Title

      日本データベース学会Letters 5(2)

      Pages: 29-32

  • [Journal Article] Web検索エンジンのインデックスを用いた同位語とそのコンテキストの発見2006

    • Author(s)
      大島 裕明, 小山 聡, 田中 克己
    • Journal Title

      情報処理学会論文誌 : データベース 47(SIG19)(TOD32)

      Pages: 98-112

URL: 

Published: 2008-05-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi