• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

単語と文書の意味クラスをベースとするスクリプトの自動学習に関する研究

Research Project

Project/Area Number 15680005
Research InstitutionJapan Advanced Institute of Science and Technology

Principal Investigator

鳥澤 健太郎  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (70282712)

Keywords自然言語処理 / スクリプト / 知識獲得 / 統計的自然言語処理 / プラン認識 / 生成語彙論 / シソーラス / テキストコーパス
Research Abstract

今年度は、HTMLタグを用いた単語クラスの自動学習の研究、および、単なる名詞連続からの概念具体物関係の自動学習、ならびにイベント間の時間的前後関係の自動学習の研究を行った。特に概念具体物関係の自動獲得は間接的に本研究で重要な役割を果たす単語意味クラスの自動学習を行っていることになる。
まず、単語意味クラスの自動学習の研究に関してはHTML文書中で同一の箇条書きに現れる表現が意味的一貫性を持ちやすいという我々の観察に基づき、検索エンジンのヒットカウントと教師あり学習の一手法であるSVMを用いることで、高速に単語意味クラスを抽出する手法を研究した。
ついで、ある種の言語的なパターンは、概念具体物関係を表しやすく、またそこから概念具体物関係を比較的容易に抽出できることは知られていたが、「オンラインショッピングサイト楽天」のように単なる名詞連続で概念具体物関係を表すものから関係を抽出することは行われていなかった。我々は、概念名を表しやすい単語が存在し、これらを他の言語的パターンから抽出し、さらに検索エンジンを利用したフィルタリングをおこなうことで、高精度に概念具体物関係を抽出できることを示した。
また、イベント間の時間的前後関係に関しては、日本語のいわゆる並列動詞句ならびに、動詞と名詞の共起頻度をもとに、時間的な前後関係を持ち、同時に論理的な含意関係を持つ二つのイベント間の関係を大量のコーパスから自動的に学習する手法について研究した。

  • Research Products

    (5 results)

All 2006 2005

All Journal Article (4 results) Book (1 results)

  • [Journal Article] Acquiring Inference Rules with Temporal Constraings by using Japanese Coordinated Sentences and Noun-Verb Co-occurrences2006

    • Author(s)
      Kentaro Torisawa
    • Journal Title

      Proceedings of Human Language Technology Conference/North American chapter the Association for Computational Linguistics (to appear)

  • [Journal Article] 対象の用途と準備を表す表現の自動獲得2006

    • Author(s)
      鳥澤健太郎
    • Journal Title

      自然言語処理 13(2)

      Pages: 125-144

  • [Journal Article] A Simple WWW-based Method for Semantic Word Class Acquisition2005

    • Author(s)
      Keiji Shinzato, Kentaro Torisawa
    • Journal Title

      Proceedings of the Recent Advances in Natural Langage Processing

      Pages: 493-500

  • [Journal Article] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • Author(s)
      Kentaro Torisawa
    • Journal Title

      Proceedings of Recent Advances in Natural Language Processing (RANLP 05)

      Pages: 556-560

  • [Book] A Chapter "A Simple WWW-based Method for Semantic Word Class Acquisition" in Recent Advances in Natural Language Processing2006

    • Author(s)
      Keiji Shinzato, Kentaro Torisawa
    • Publisher
      John Benjamins Publishers(to be published)

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi