• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

参照の同一性判定に基づく複数Webページの検索閲覧方式の研究

研究課題

研究課題/領域番号 16700097
研究種目

若手研究(B)

配分区分補助金
研究分野 メディア情報学・データベース
研究機関京都大学

研究代表者

小山 聡  京都大学, 情報学研究科, 助手 (30346100)

研究期間 (年度) 2004 – 2006
研究課題ステータス 完了 (2006年度)
配分額 *注記
3,600千円 (直接経費: 3,600千円)
2006年度: 1,000千円 (直接経費: 1,000千円)
2005年度: 1,000千円 (直接経費: 1,000千円)
2004年度: 1,600千円 (直接経費: 1,600千円)
キーワードWeb検索 / オブジェクト識別 / クラスタリング / 機械学習 / 情報抽出 / 情報統合 / Webマイニング / Web閲覧インタフェース / 文書構造 / 類似度 / 文脈依存検索 / カーネル法 / 共参照解決 / オブジェクト同定 / 類似度の学習 / 質問修正 / Web閲覧インターフェース
研究概要

オブジェクト識別は,文書集合等に現れる人名や店舗名などが実世界の同じオブジェクトを指しているか否かを判別する問題であり,通常,対象の名前を含む文書を,それらの間の類似度や距離に基づいてクラスタリングすることで解決される.しかしながら,目的に合致した適切な類似度や距離を用いなければ,望ましいクラスタリング結果を得ることはできない.従来,人手でラベル付けされた例題から,類似度や距離を学習させる研究が行われてきたが,人的なコストが掛かるという問題があった.我々は,オブジェクト識別を行う際にクラスタリングで用いる距離を,人間の教師を必要とせずに学習させる手法を提案した.提案手法は,別名の別オブジェクトへの対応と名前の恣意性という2つの仮定に基づいている.これらの2つの仮定が成り立てば,異なる名前を含むデータ対をリンク不可な例題として学習した距離を,同じ名前を持つデータのオブジェクト識別に用いることができるため,訓練集合の人手での作成が不要になる.リンク不可なデータ対のみを例題として用いる距離の学習は,凸2次計画問題として定式化され,一般の距離行列を学習する際に必要な半正定値計画問題よりも,高速に解くことが可能である.また,オブジェクトに関する情報を複数ページから抽出し統合する例として,対象となる人物の経歴情報をWeb検索結果中から収集する手法の研究を行った.さらに,複数Webページの検索閲覧を支援するために,ユーザが与えた語と兄弟関係にある語を発見する手法,およびユーザが与えたWebページの話題と兄弟カテゴリに属する話題を記述したページを発見する手法を開発した.そして,目的のオブジェクトに関するページを効率良く取得するため,話題語をノードとするグラフでWebページ集合を表現し,グラフを操作させることでユーザからのフィードバックを得るユーザインタフェースの研究を行った.

報告書

(3件)
  • 2006 実績報告書
  • 2005 実績報告書
  • 2004 実績報告書
  • 研究成果

    (19件)

すべて 2007 2006 2005 2004

すべて 雑誌論文 (19件)

  • [雑誌論文] 文書群を問合せとした兄弟カテゴリ文書の検索2007

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      電子情報通信学会論文誌 J90-D(2)

      ページ: 196-208

    • NAID

      110007380653

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Web検索結果におけるキーワード出現相関の可視化と対話的な質問変換2007

    • 著者名/発表者名
      吉田 大我, 小山 聡, 中村 聡史, 田中 克己
    • 雑誌名

      電子情報通信学会第18回データエ学ワークショップ(DEWS 2007)論文集

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Learning a Distance Metric for Object Identification without Human Supervision2006

    • 著者名/発表者名
      Satoshi Oyama, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Artificial Intelligence (Proceedings of PKDD 2006) 4213

      ページ: 609-616

    • NAID

      110004744917

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Searching Coordinate Terms with their Context from the Web2006

    • 著者名/発表者名
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Computer Science (Proceedings of WISE 2006) 4255

      ページ: 40-47

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Sibling Page Search by Page Examples2006

    • 著者名/発表者名
      Hiroaki Ohshima, Satoshi Oyama, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Computer Science (Proceedings of ICADL2006) 4312

      ページ: 91-100

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 文書群をクエリとした似て非なる文書の検索2006

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      日本データベース学会Letters 5(1)

      ページ: 121-124

    • NAID

      40015217346

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Webからの人物事典生成のための経歴情報の自動収集2006

    • 著者名/発表者名
      木村 塁, 小山 聡, 田中 克己
    • 雑誌名

      日本データベース学会Letters 5(2)

      ページ: 29-32

    • NAID

      40015217365

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Web検索エンジンのインデックスを用いた同位語とそのコンテキストの発見2006

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      情報処理学会論文誌 : データベース 47(SIG19)(TOD32)

      ページ: 98-112

    • NAID

      110006160105

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Context Matcher : Improved Web Search Using Query Term Context in Source Document and in Search Results2006

    • 著者名/発表者名
      Takahiro Kawashige, Satoshi Oyama, Hiroaki Ohshima, Katsumi Tanaka
    • 雑誌名

      Lecture Notes in Computer Science (Proceedings of the 8th Asia Pacific Web Conference (APWeb2006)) Vol.3841

      ページ: 486-497

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Webの構造情報とプロファイル抽出を用いたオブジェクト識別2006

    • 著者名/発表者名
      白砂 健一, 小山 聡, 田島 敬史, 田中 克己
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] レビューページ例からの属性抽出に基づくレビューページ検索2006

    • 著者名/発表者名
      赤木 法生, 大島 裕明, 小山 聡, 田島 敬史, 田中 克己
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 質問修正と再ランキングを用いた文脈依存Web検索2006

    • 著者名/発表者名
      河重 貴洋, 小山 聡, 大島 裕明, 田中 克己
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 複数Webサイトからの共通側面の抽出と類似サイト検索2006

    • 著者名/発表者名
      小谷 彬, 小山 聡, 田中 克己
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 文書群をクエリとした似て非なる文書の検索2006

    • 著者名/発表者名
      大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      電子情報通信学会第17回データ工学ワークショップ(DEWS2006)論文集

    • NAID

      40015217346

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 複数Webコンテンツの多面的閲覧のための空間インタフェース2005

    • 著者名/発表者名
      小谷 彬, 小山 聡, 田中 克己
    • 雑誌名

      日本データベース学会Letters Vol.4,No.1

      ページ: 161-164

    • NAID

      40007013168

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 異なる例からの素性の組合せを用いたペアワイズ分類器の学習2005

    • 著者名/発表者名
      小山 聡, クリストファー D.マニング
    • 雑誌名

      人工知能学会論文誌 Vol.20, No.2

      ページ: 105-116

    • NAID

      10022004970

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 検索語の閲覧文書と検索結果における文脈を利用した質問修正2005

    • 著者名/発表者名
      河重 貴洋, 大島 裕明, 小山 聡, 田中 克己
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005)論文集

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] 複数Webコンテンツの多面的閲覧のための空間インタフェース2005

    • 著者名/発表者名
      小谷 彬, 小山 聡, 田中 克己
    • 雑誌名

      電子情報通信学会第16回データ工学ワークショップ(DEWS2005)論文集

    • NAID

      40007013168

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Using Feature Conjunctions across Examples for Learning Pairwise Classifiers2004

    • 著者名/発表者名
      Satoshi Oyama, Christnpher D Manning
    • 雑誌名

      Lecture Notes in Artificial Intelligence (Proceedings of the 15th European Conference on Machine Learning (ECML2004)) Vol.3201

      ページ: 322-333

    • NAID

      10022004970

    • 関連する報告書
      2004 実績報告書

URL: 

公開日: 2004-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi