• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

WWW上のイベント自動追跡システムに関する研究

Research Project

Project/Area Number 15650015
Research Category

Grant-in-Aid for Exploratory Research

Allocation TypeSingle-year Grants
Research Field Media informatics/Database
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

鳥澤 健太郎  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (70282712)

Co-Investigator(Kenkyū-buntansha) 白井 清昭  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30302970)
Project Period (FY) 2003 – 2005
Project Status Completed (Fiscal Year 2005)
Budget Amount *help
¥3,100,000 (Direct Cost: ¥3,100,000)
Fiscal Year 2005: ¥600,000 (Direct Cost: ¥600,000)
Fiscal Year 2004: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2003: ¥1,300,000 (Direct Cost: ¥1,300,000)
KeywordsWWW / 情報追跡 / 情報検索 / クロウラー / 自然言語処理 / 統計的自然言語処理 / 言い換え
Research Abstract

今年度は、まず、イベントの自動追跡で必要とされる同一の出来事を異なる表現で表すいわゆる言い換えの関係の自動学習の研究、ならびにページタイプの同定に関する研究を行った。
まず、言い換えの自動学習に関しては、日本語のいわゆる並列動詞句ならびに、動詞と名詞の共起頻度をもとに、言い換えの関係にあり、なおかつ論理的な含意関係を持つ二つの記述間の関係を大量のコーパスから自動的に学習する手法について研究した。特に、論理的含意を持ちやすい記述間の関係を高精度で学習するため、形式論理における意味理論にインスパイアされた手法を開発した。これは、形式論理における含意の概念を突き詰めていくと、これはある言語表現で現され得るイベントのインスタンス間での写像に関する条件に対応し、その写像をランダムに構成するときの「構成の容易さ」を確率で表すことにより、含意の成立のしやすさを表すパラメータとして単なる動詞の出現頻度を考えることができるという発想によっている。これにより、実際に含意関係の獲得精度が10%近く向上し、実際にアルゴリズムが出力したイベント間の関係の約70%が実際に論理的含意関係を持っていることが実験により確認された。
ページタイプの同定に関しては、具体的にはリンク集を主たるコンテンツとするページ(リンク集ページ)か否かの判別を行った。判別はHTMLタグのパターンマッチによってリンク集を検出することにより行う。リンク集ページは更新頻度が少ないページと考えられるので、これらを定期観察するページから除外することによりイベントの自動追跡の効率化が可能となる。

Report

(3 results)
  • 2005 Annual Research Report
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • Research Products

    (15 results)

All 2006 2005 2004 Other

All Journal Article (9 results) Publications (6 results)

  • [Journal Article] 対象の用途と準備を表す表現の自動獲得2006

    • Author(s)
      鳥澤健太郎
    • Journal Title

      自然言語処理 13(2)

      Pages: 125-144

    • NAID

      10018136873

    • Related Report
      2005 Annual Research Report
  • [Journal Article] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • Author(s)
      Kentaro Torisawa
    • Journal Title

      Proceedings of Recent Advances in Natural Language Processing (RANLP 05)

      Pages: 556-560

    • Related Report
      2005 Annual Research Report
  • [Journal Article] HTML文書からの上位下位関係の自動獲得2005

    • Author(s)
      新里圭司, 鳥澤健太郎
    • Journal Title

      自然言語処理 12・1

      Pages: 125-150

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • Author(s)
      Kentaro Torisawa
    • Journal Title

      In Proceedings of The Nineteenth International Joint Conference on Artificial Intelligence (IJCAI-05) (To appear)

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Integrating Tables on the World Wide Web2004

    • Author(s)
      Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii
    • Journal Title

      人工知能学会論文誌 19・6

      Pages: 548-560

    • NAID

      10014165007

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Extracting Hyponyms of Prespecified Hypernyms from Itemizations and Headings in Web Documents2004

    • Author(s)
      Keiji Shinzato, Kentaro Torisawa
    • Journal Title

      In Proceedings of The 20^<th> International Conference on Computational Linguistics (COLING04)

      Pages: 938-944

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Improving the Identification of Non-Anaphoric it using Support Vector Machines2004

    • Author(s)
      Jose Carlos Clemente Litran, Kenji Sato, Kentaro Torisawa
    • Journal Title

      In Proceedings of International Workshop on Natural Language Processing and its Applications (NLPBA/BioNLP 2004)

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Learning a Robust Word Sense Disambiguation Model using Hypernyms in Definition Sentences2004

    • Author(s)
      Kiyoaki Shirai, Tsunekazu Yagi
    • Journal Title

      In Proceedings of The 20^<th> International Conference on Computational Linguistics (COLING04)

      Pages: 917-923

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Acquiring Inference Rules with Temporal Constraings by using Japanese Coordinated Sentences and Noun-Verb Co-occurrences

    • Author(s)
      Kentaro Torisawa
    • Journal Title

      Proceedings of Human Language TechnologyConference/North American chapter the Association for Computational Linguistics (to appear)

    • Related Report
      2005 Annual Research Report
  • [Publications] Keiji Shinzato, Kentaro Torisawa: "Acquiring Hyponymy Relations from Web Documents"Proceedings of Human Language Technology/North American Chapter of Association of Computational Linguistics 2004. (in print). (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Naoki Yoshinaga, Yusuke Miyao, Kentaro Torisawa, Jun'ichi Tsujii: "Parsing Comparison across Grammar Formalisms using Strongly Equivalent Grammar"Traitement Automatique des Langue, Special Issue on Evolutions in Parsing. 44・3(in print). (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Kentaro Torisawa: "An Unsupervised Learning Method for Commonsensical Inference Rules on Events"in Proceedings of the Second CoLogNet-ElsNET Symposium. 146-153 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Naoki Yoshinaga, Kentaro Torisawa, Jun'ichi Tsujii: "Comparison between CFG filtering techniques for LTAG and HPSG"In the Proceedings of the 41st ACL companion volume. 185-188 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Kiyoaki Shirai, Takayuki Tamagaki: "Word Sense Disambiguation using Heterogeneous Language Resources"In the Proceedings of the first International Joint Conference of Natural Language Processing (IJCNLP-2004). 614-619 (2004)

    • Related Report
      2003 Annual Research Report
  • [Publications] Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii: "Extracting attributes and their values from Web pages, chapter in Web Document Analysis - Challenges and Opportunities"World Scientific - Series in Machine Perception and Artificial Intelligence. (2003)

    • Related Report
      2003 Annual Research Report

URL: 

Published: 2003-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi