• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

単語と文書の意味クラスをベースとするスクリプトの自動学習に関する研究

研究課題

研究課題/領域番号 15680005
研究種目

若手研究(A)

配分区分補助金
研究分野 知能情報学
研究機関北陸先端科学技術大学院大学

研究代表者

鳥澤 健太郎  北陸先端科学技術大学院大学, 情報科学研究科, 助教授 (70282712)

研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
24,960千円 (直接経費: 19,200千円、間接経費: 5,760千円)
2005年度: 5,200千円 (直接経費: 4,000千円、間接経費: 1,200千円)
2004年度: 7,410千円 (直接経費: 5,700千円、間接経費: 1,710千円)
2003年度: 12,350千円 (直接経費: 9,500千円、間接経費: 2,850千円)
キーワード自然言語処理 / スクリプト / 知識獲得 / 統計的自然言語処理 / プラン認識 / 生成語彙論 / シソーラス / テキストコーパス / 常識的知識 / 機械学習
研究概要

今年度は、HTMLタグを用いた単語クラスの自動学習の研究、および、単なる名詞連続からの概念具体物関係の自動学習、ならびにイベント間の時間的前後関係の自動学習の研究を行った。特に概念具体物関係の自動獲得は間接的に本研究で重要な役割を果たす単語意味クラスの自動学習を行っていることになる。
まず、単語意味クラスの自動学習の研究に関してはHTML文書中で同一の箇条書きに現れる表現が意味的一貫性を持ちやすいという我々の観察に基づき、検索エンジンのヒットカウントと教師あり学習の一手法であるSVMを用いることで、高速に単語意味クラスを抽出する手法を研究した。
ついで、ある種の言語的なパターンは、概念具体物関係を表しやすく、またそこから概念具体物関係を比較的容易に抽出できることは知られていたが、「オンラインショッピングサイト楽天」のように単なる名詞連続で概念具体物関係を表すものから関係を抽出することは行われていなかった。我々は、概念名を表しやすい単語が存在し、これらを他の言語的パターンから抽出し、さらに検索エンジンを利用したフィルタリングをおこなうことで、高精度に概念具体物関係を抽出できることを示した。
また、イベント間の時間的前後関係に関しては、日本語のいわゆる並列動詞句ならびに、動詞と名詞の共起頻度をもとに、時間的な前後関係を持ち、同時に論理的な含意関係を持つ二つのイベント間の関係を大量のコーパスから自動的に学習する手法について研究した。

報告書

(3件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (15件)

すべて 2006 2005 2004 その他

すべて 雑誌論文 (9件) 図書 (1件) 文献書誌 (5件)

  • [雑誌論文] Acquiring Inference Rules with Temporal Constraings by using Japanese Coordinated Sentences and Noun-Verb Co-occurrences2006

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      Proceedings of Human Language Technology Conference/North American chapter the Association for Computational Linguistics (to appear)

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 対象の用途と準備を表す表現の自動獲得2006

    • 著者名/発表者名
      鳥澤健太郎
    • 雑誌名

      自然言語処理 13(2)

      ページ: 125-144

    • NAID

      10018136873

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] A Simple WWW-based Method for Semantic Word Class Acquisition2005

    • 著者名/発表者名
      Keiji Shinzato, Kentaro Torisawa
    • 雑誌名

      Proceedings of the Recent Advances in Natural Langage Processing

      ページ: 493-500

    • NAID

      110006291052

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      Proceedings of Recent Advances in Natural Language Processing (RANLP 05)

      ページ: 556-560

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] HTML文書からの上位下位関係の自動獲得2005

    • 著者名/発表者名
      新里圭司, 鳥澤健太郎
    • 雑誌名

      自然言語処理 12・1

      ページ: 125-150

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Automatic Acquisition of Expressions Representing Preparation and Utilization of an Object2005

    • 著者名/発表者名
      Kentaro Torisawa
    • 雑誌名

      In Proceedings of The Nineteenth International Joint Conference on Artificial Intelligence (IJCAI-05) (To appear)

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Integrating Tables on the World Wide Web2004

    • 著者名/発表者名
      Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii
    • 雑誌名

      人工知能学会論文誌 19・6

      ページ: 548-560

    • NAID

      10014165007

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Extracting Hyponyms of Prespecified Hypernyms from Itemizations and Headings in Web Documents2004

    • 著者名/発表者名
      Keiji Shinzato, Kentaro Torisawa
    • 雑誌名

      In Proceedings of The 20^<th> International Conference on Computational Linguistics (COLING04)

      ページ: 938-944

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Improving the Identification of Non-Anaphoric it using Support Vector Machines2004

    • 著者名/発表者名
      Jose Carlos Clemente Litran, Kenji Sato, Kentaro Torisawa
    • 雑誌名

      In Proceedings of International Workshop on Natural Language Processing and its Applications (NLPBA/BioNLP 2004)

    • 関連する報告書
      2004 実績報告書
  • [図書] A Chapter "A Simple WWW-based Method for Semantic Word Class Acquisition" in Recent Advances in Natural Language Processing2006

    • 著者名/発表者名
      Keiji Shinzato, Kentaro Torisawa
    • 出版者
      John Benjamins Publishers(to be published)
    • 関連する報告書
      2005 実績報告書
  • [文献書誌] Keiji Shinzato, Kentaro Torisawa: "Acquiring Hyponymy Relations from Web Documents"Proceedings of Human Language Technology/North American Chapter of Association of Computational Linguistics 2004. (in print). (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Naoki Yoshinaga, Yusuke Miyao, Kentaro Torisawa, Jun'ichi Tsujii: "Parsing Comparison across Grammar Formalisms using Strongly Equivalent Grammar"Traitement Automatique des Langue, Special Issue on Evolutions in Parsing. 44・3(in print). (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Kentaro Torisawa: "An Unsupervised Learning Method for Commonsensical Inference Rules on Events"in Proceedings of the Second CoLogNet-ElsNET Symposium. 146-153 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Naoki Yoshinaga, Kentaro Torisawa, Jun'ichi Tsujii: "Comparison between CFG filtering techniques for LTAG and HPSG"In the Proceedings of the 41st ACL companion volume. 185-188 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Minoru Yoshida, Kentaro Torisawa, Jun'ichi Tsujii: "Extracting attributes and their values from Web pages, chapter in Web Document Analysis - Challenges and Opportunities"World Scientific - Series in Machine Perception and Artificial Intelligence. (2003)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi