• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2004 年度 実績報告書

WWW上のイベント自動追跡システムに関する研究

研究課題

研究課題/領域番号 15650015
研究機関北陸先端科学技術大学院大学

研究代表者

鳥澤 健太郎  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (70282712)

研究分担者 白井 清昭  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30302970)
キーワードWWW / 情報追跡 / 情報検索 / クロウラー
研究概要

本研究では、WWW上のドキュメントを元に、そのドキュメントに書かれている対象がどのような時間的変遷を辿るかをWWW上で自動的に追跡し、その対象に関する新規で重要なイベントをユーザーに通知するシステムを開発する。ここでいうイベントとは、例えば、新規に開発される自動車が対象であるとすれば、開発の噂から、発売発表、評論家の評価、モデルチェンジといった自動車が辿る典型的なイベントを考えている。
本年度は、昨年度に引き続き、対象にとって重要なイベントをさす「イベント語」の自動抽出と、イベント語間の言い換えの抽出に関して研究を行った。この際にHTML文書中のHTMLタグが重要な手がかりを与えてくれることを確認した。また、ある対象を辿るにあたって、対象が通る道筋である「対象の準備」「対象の用途」を指し示す表現の自動獲得についての研究も行った。例えば、この手法を使うと、通常、「本を出版する」は「本を読む」というイベントの準備段階であるとみなすことができ、さらに「本を読む」ことに時間的に先立つといった知識が獲得できる。このような知識は「本」に関するイベントに関する情報を追跡する際に非常に重要な役割を果たすものと考えられる。さらに、対象に関する情報を抽出する際に重要な手がかかりになると考えられる対象の上位語を自動獲得する手法に関する研究も行った。
さらに、イベント追跡の対象となるウェブページ(モニタリング対象ページ)の選別に関する研究にも取り組んだ。まず、追跡対象となるイベントを表わすキーワードをクエリとして検索を行った。次に、得られたウェブページの中から頻繁に更新されるページを選別した。この際、実際にウェブページを定期的に観察しなくても、リンク構造やページ内の更新を示唆するキーワード(「最終更新」など)が選別の有効な手がかりとなることを確認した。また、モニタリング対象ページに対して定期的に観測を行い、ユーザに通知するべきイベントを検出する手法の検討を行った。

  • 研究成果

    (6件)

すべて 2005 2004

すべて 雑誌論文 (6件)

  • [雑誌論文] HTML文書からの上位下位関係の自動獲得2005

    • 著者名/発表者名
      新里圭司, 鳥澤健太郎
    • 雑誌名

      自然言語処理 12・1

      ページ: 125-150

  • [雑誌論文] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      In Proceedings of The Nineteenth International Joint Conference on Artificial Intelligence (IJCAI-05) (To appear)

  • [雑誌論文] Integrating Tables on the World Wide Web2004

    • 著者名/発表者名
      Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii
    • 雑誌名

      人工知能学会論文誌 19・6

      ページ: 548-560

  • [雑誌論文] Extracting Hyponyms of Prespecified Hypernyms from Itemizations and Headings in Web Documents2004

    • 著者名/発表者名
      Keiji Shinzato, Kentaro Torisawa
    • 雑誌名

      In Proceedings of The 20^<th> International Conference on Computational Linguistics (COLING04)

      ページ: 938-944

  • [雑誌論文] Improving the Identification of Non-Anaphoric it using Support Vector Machines2004

    • 著者名/発表者名
      Jose Carlos Clemente Litran, Kenji Sato, Kentaro Torisawa
    • 雑誌名

      In Proceedings of International Workshop on Natural Language Processing and its Applications (NLPBA/BioNLP 2004)

  • [雑誌論文] Learning a Robust Word Sense Disambiguation Model using Hypernyms in Definition Sentences2004

    • 著者名/発表者名
      Kiyoaki Shirai, Tsunekazu Yagi
    • 雑誌名

      In Proceedings of The 20^<th> International Conference on Computational Linguistics (COLING04)

      ページ: 917-923

URL: 

公開日: 2006-07-12   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi