• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2005 年度 実績報告書

WWW上のイベント自動追跡システムに関する研究

研究課題

研究課題/領域番号 15650015
研究機関北陸先端科学技術大学院大学

研究代表者

鳥澤 健太郎  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (70282712)

研究分担者 白井 清昭  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (30302970)
キーワードWWW / 情報追跡 / 情報検索 / クロウラー
研究概要

今年度は、まず、イベントの自動追跡で必要とされる同一の出来事を異なる表現で表すいわゆる言い換えの関係の自動学習の研究、ならびにページタイプの同定に関する研究を行った。
まず、言い換えの自動学習に関しては、日本語のいわゆる並列動詞句ならびに、動詞と名詞の共起頻度をもとに、言い換えの関係にあり、なおかつ論理的な含意関係を持つ二つの記述間の関係を大量のコーパスから自動的に学習する手法について研究した。特に、論理的含意を持ちやすい記述間の関係を高精度で学習するため、形式論理における意味理論にインスパイアされた手法を開発した。これは、形式論理における含意の概念を突き詰めていくと、これはある言語表現で現され得るイベントのインスタンス間での写像に関する条件に対応し、その写像をランダムに構成するときの「構成の容易さ」を確率で表すことにより、含意の成立のしやすさを表すパラメータとして単なる動詞の出現頻度を考えることができるという発想によっている。これにより、実際に含意関係の獲得精度が10%近く向上し、実際にアルゴリズムが出力したイベント間の関係の約70%が実際に論理的含意関係を持っていることが実験により確認された。
ページタイプの同定に関しては、具体的にはリンク集を主たるコンテンツとするページ(リンク集ページ)か否かの判別を行った。判別はHTMLタグのパターンマッチによってリンク集を検出することにより行う。リンク集ページは更新頻度が少ないページと考えられるので、これらを定期観察するページから除外することによりイベントの自動追跡の効率化が可能となる。

  • 研究成果

    (3件)

すべて 2006 2005 その他

すべて 雑誌論文 (3件)

  • [雑誌論文] 対象の用途と準備を表す表現の自動獲得2006

    • 著者名/発表者名
      鳥澤健太郎
    • 雑誌名

      自然言語処理 13(2)

      ページ: 125-144

  • [雑誌論文] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      Proceedings of Recent Advances in Natural Language Processing (RANLP 05)

      ページ: 556-560

  • [雑誌論文] Acquiring Inference Rules with Temporal Constraings by using Japanese Coordinated Sentences and Noun-Verb Co-occurrences

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      Proceedings of Human Language TechnologyConference/North American chapter the Association for Computational Linguistics (to appear)

URL: 

公開日: 2007-04-02   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi