• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

参照の同一性判定に基づく複数Webページの検索閲覧方式の研究

研究課題

研究課題/領域番号 16700097
研究機関京都大学

研究代表者

小山 聡  京都大学, 情報学研究科, 助手 (30346100)

キーワードWeb検索 / オブジェクト識別 / クラスタリング / 機械学習 / 情報抽出 / 情報統合 / Webマイニング / Web閲覧インタフェース
研究概要

オブジェクト識別は,文書集合等に現れる人名や店舗名などが実世界の同じオブジェクトを指しているか否かを判別する問題であり,通常,対象の名前を含む文書を,それらの間の類似度や距離に基づいてクラスタリングすることで解決される.しかしながら,目的に合致した適切な類似度や距離を用いなければ,望ましいクラスタリング結果を得ることはできない.従来,人手でラベル付けされた例題から,類似度や距離を学習させる研究が行われてきたが,人的なコストが掛かるという問題があった.我々は,オブジェクト識別を行う際にクラスタリングで用いる距離を,人間の教師を必要とせずに学習させる手法を提案した.提案手法は,別名の別オブジェクトへの対応と名前の恣意性という2つの仮定に基づいている.これらの2つの仮定が成り立てば,異なる名前を含むデータ対をリンク不可な例題として学習した距離を,同じ名前を持つデータのオブジェクト識別に用いることができるため,訓練集合の人手での作成が不要になる.リンク不可なデータ対のみを例題として用いる距離の学習は,凸2次計画問題として定式化され,一般の距離行列を学習する際に必要な半正定値計画問題よりも,高速に解くことが可能である.また,オブジェクトに関する情報を複数ページから抽出し統合する例として,対象となる人物の経歴情報をWeb検索結果中から収集する手法の研究を行った.さらに,複数Webページの検索閲覧を支援するために,ユーザが与えた語と兄弟関係にある語を発見する手法,およびユーザが与えたWebページの話題と兄弟カテゴリに属する話題を記述したページを発見する手法を開発した.そして,目的のオブジェクトに関するページを効率良く取得するため,話題語をノードとするグラフでWebページ集合を表現し,グラフを操作させることでユーザからのフィードバックを得るユーザインタフェースの研究を行った.

  • 研究成果

    (8件)

すべて 2007 2006

すべて 雑誌論文 (8件)

  • [雑誌論文] 文書群を問合せとした兄弟カテゴリ文書の検索2007

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      電子情報通信学会論文誌 J90-D(2)

      ページ: 196-208

  • [雑誌論文] Web検索結果におけるキーワード出現相関の可視化と対話的な質問変換2007

    • 著者名/発表者名
      吉田 大我, 小山 聡, 中村 聡史, 田中 克己
    • 雑誌名

      電子情報通信学会第18回データエ学ワークショップ(DEWS 2007)論文集

      ページ: C7-2

  • [雑誌論文] Learning a Distance Metric for Object Identification without Human Supervision2006

    • 著者名/発表者名
      Satoshi Oyama, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Artificial Intelligence (Proceedings of PKDD 2006) 4213

      ページ: 609-616

  • [雑誌論文] Searching Coordinate Terms with their Context from the Web2006

    • 著者名/発表者名
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Computer Science (Proceedings of WISE 2006) 4255

      ページ: 40-47

  • [雑誌論文] Sibling Page Search by Page Examples2006

    • 著者名/発表者名
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Computer Science (Proceedings of ICADL2006) 4312

      ページ: 91-100

  • [雑誌論文] 文書群をクエリとした似て非なる文書の検索2006

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      日本データベース学会Letters 5(1)

      ページ: 121-124

  • [雑誌論文] Webからの人物事典生成のための経歴情報の自動収集2006

    • 著者名/発表者名
      木村 塁, 小山 聡, 田中 克己
    • 雑誌名

      日本データベース学会Letters 5(2)

      ページ: 29-32

  • [雑誌論文] Web検索エンジンのインデックスを用いた同位語とそのコンテキストの発見2006

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      情報処理学会論文誌 : データベース 47(SIG19)(TOD32)

      ページ: 98-112

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi