• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文脈に最適な言い換えをWebから自動獲得する手法に関する研究

研究課題

研究課題/領域番号 17700144
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関北陸先端科学技術大学院大学

研究代表者

風間 淳一  北陸先端科学技術大学院大学, 情報科学研究科, 助教 (60377439)

研究期間 (年度) 2005 – 2007
研究課題ステータス 完了 (2007年度)
配分額 *注記
3,200千円 (直接経費: 3,200千円)
2007年度: 800千円 (直接経費: 800千円)
2006年度: 1,100千円 (直接経費: 1,100千円)
2005年度: 1,300千円 (直接経費: 1,300千円)
キーワード言い換え / Web / 固有表現認識 / 大域的素性 / 固有表現辞書 / Wikipedia / クラスタリング / 自動獲得 / 属性 / 木構造カーネル
研究概要

平成19年度の研究実績は以下の通りである。言い換えの獲得において、固有表現に注目することが有効であることが知られている。しかし、固有表現を高精度で認識すること自体難しい処理である。そこで、固有表現認識について、従来の手法では考慮することのできなかった「大域的素性」を利用する新しいパーセプトロン学習法を提案した。また、多種多様な固有表現の出現する文書に対応するため、近年その量と質から注目を浴びているWikipediaから固有表現辞書を抽出して利用する方法を提案し、これらの成果を国際学会「EMNLP-CoNLL2007」において発表した。また、名詞と動詞の係り受けのクラスタリングを利用して固有表現辞書を獲得し、利用する方法を開発し、効果を確認した。この成果は、「言語処理学会年次大会」(査読なし)において発表した。また、国際会議である「ACL08:HLT」にも受理され、発表予定である。このクラスタリングで得られる確率モデルは、名詞や動詞のクラスや言い換えを名詞と動詞の文脈を考慮した上で確率付きで生成することができ、その応用は多岐にわたる。その一つとして、単語群を画面上に配置する際の単語間の距離を求めることに利用する研究なども行った。

報告書

(3件)
  • 2007 実績報告書
  • 2006 実績報告書
  • 2005 実績報告書
  • 研究成果

    (11件)

すべて 2008 2007 2006 2005

すべて 雑誌論文 (8件) 学会発表 (3件)

  • [雑誌論文] 大域的素性を用いたタグ付けのためのパーセプトロン学習2007

    • 著者名/発表者名
      風間 淳一, 鳥澤 健太郎
    • 雑誌名

      言語処理学会第13回年次大会

      ページ: 103-106

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Semantic Role Recognition using Kernels on Weighted Marked Ordered Labeled Trees2006

    • 著者名/発表者名
      Jun'ichi Kazama, Kentaro Torisawa
    • 雑誌名

      Proceedings of the Tenth Conference on Computational Natural Language Learning (CoNLL-X)

      ページ: 53-60

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] 属性語のWeb文書からの目動獲得と人手評価のための基準2006

    • 著者名/発表者名
      徳永 耕亮, 風間 淳一, 鳥澤 健太郎
    • 雑誌名

      自然言語処理 13(4)

      ページ: 49-67

    • 関連する報告書
      2006 実績報告書
  • [雑誌論文] Automatic Discovery of Attribute Words from Web Documents2006

    • 著者名/発表者名
      Kosuke Tokunaga, Jun'ichi Kazama, Kentaro Torisawa
    • 雑誌名

      LNAI 3651, Natural Language Processing - IJCNLP 2005

      ページ: 106-118

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] 木構造カーネルの高速化とノード関係分類への応用2006

    • 著者名/発表者名
      風間 淳一, 鳥澤 健太郎
    • 雑誌名

      言語処理学会第12回年次大会

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Speeding up Training with Tree Kernels for Node Relation Labeling2005

    • 著者名/発表者名
      Jun'ichi Kazama, Kentaro Torisawa
    • 雑誌名

      Proceedings of the Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing (HLT/EMNLP 2005)

      ページ: 137-144

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Maximum Entropy Models with Inequality Constraints : A case study on text categorization.2005

    • 著者名/発表者名
      Jun'ichi Kazama, Jun'ichi Tsujii
    • 雑誌名

      Machine Learning 60(1-3)

      ページ: 159-194

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] HTML文書からの属性語の自動抽出2005

    • 著者名/発表者名
      徳永 耕亮, 風間 淳一, 鳥澤 健太郎
    • 雑誌名

      言語処理学会第11回年次大会

    • 関連する報告書
      2005 実績報告書
  • [学会発表] Webの資源から構築した複数の固有表現辞書を用いた日本語固有表現認識2008

    • 著者名/発表者名
      風間 淳一 鳥澤 健太郎
    • 学会等名
      言語処理学会第14回年次大会
    • 発表場所
      東京
    • 年月日
      2008-03-20
    • 関連する報告書
      2007 実績報告書
  • [学会発表] Exploiting Wikipedia as External Knowledge for Named Entity Recognition2007

    • 著者名/発表者名
      Jun'ichi Kazama and Kentaro Torisawa
    • 学会等名
      EMNLP-CoNLL2007
    • 発表場所
      プラハ、チェコ
    • 年月日
      2007-06-29
    • 関連する報告書
      2007 実績報告書
  • [学会発表] A New Perceptron Algorithm for Sequence Labeling with Non-local Features2007

    • 著者名/発表者名
      Jun'ichi Kazama and Kentaro Torisawa
    • 学会等名
      EMNLP-CoNLL2007
    • 発表場所
      プラハ、チェコ
    • 年月日
      2007-06-28
    • 関連する報告書
      2007 実績報告書

URL: 

公開日: 2005-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi