• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

語彙化文法理論に基づく言語学的に妥当な文法の自動獲得

研究課題

研究課題/領域番号 15700120
研究種目

若手研究(B)

配分区分補助金
研究分野 知能情報学
研究機関東京大学

研究代表者

宮尾 祐介  東京大学, 大学院・情報学環, 助手 (00343096)

研究期間 (年度) 2003 – 2005
研究課題ステータス 完了 (2005年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2005年度: 700千円 (直接経費: 700千円)
2004年度: 1,200千円 (直接経費: 1,200千円)
2003年度: 1,400千円 (直接経費: 1,400千円)
キーワード文法開発 / 語彙化文法 / HPSG / 構文解析 / predicate argument structure / predicate-argument structure / Proposition Bank / 文法獲得 / Corpus annotation
研究概要

本研究課題で開発を行ってきた英語構文解析器Enjuの改良、詳細な分析、及び成果発表を行った。特に、曖昧性解消確率モデルの改良・分析を行い、その成果を国際学会で発表した。曖昧性解消には、カンマの有無、句の長さ、品詞の情報が有効に働くこと、確率モデルの学習データは比較的少量でも高精度が達成できること、長い文でも解析精度はあまり変化しないことなどを実験的に示した。これらの成果はさらなる精度向上に向けての指針となると考えられる。また、Enjuの文法および確率モデルが構文解析だけでなく文生成にも適用でき、高精度を達成することを示した。
さらに、Enjuの応用についての研究も引き続き行った。生物学論文からの情報抽出に対して、昨年度はEnjuの出力(predicate argument structure)の上のパターン規則を自動獲得することで高精度が達成できることを示したが、これに加えて、機械学習アルゴリズムSVMを組み合わせることでさらに精度を向上させる研究を行った。Predicate argument structureのパターンを機械学習の素性とすることにより、Enjuの出力を機械学習の入力として利用し、これにより、機械学習のみやパターン規則のみを用いるよりも高精度が達成できることを示した。また、生物学論文の大規模データベースMEDLINEの全アブストラクト約1,500万件をEnjuで解析し、その解析結果を利用して文献検索を行うシステムを開発した。これほど大規模なテキストを構文解析する実験は初の試みである。さらに、この文献検索システムは既存のキーワード検索に比べてはるかに高い精度で検索結果が得られることを示し、構文解析の有用性を実用アプリケーションにおいて示した。

報告書

(3件)
  • 2005 実績報告書
  • 2004 実績報告書
  • 2003 実績報告書
  • 研究成果

    (12件)

すべて 2005 2004 その他

すべて 雑誌論文 (9件) 文献書誌 (3件)

  • [雑誌論文] Probabilistic disambiguation models for wide-coverage HPSG parsing2005

    • 著者名/発表者名
      Yusuke Miyao
    • 雑誌名

      Proceedings of ACL 2005

      ページ: 83-90

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Probabilistic CFG with Latent Annotations2005

    • 著者名/発表者名
      Takuya Matsuzaki
    • 雑誌名

      Proceedings of ACL 2005

      ページ: 75-82

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Adapting a probabilistic disambiguation model of an HPSG parser to a new domain2005

    • 著者名/発表者名
      Tadayoshi Hara
    • 雑誌名

      Proceedings of IJCNLP 2005

      ページ: 199-210

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Probabilistic models for disambiguation of an HPSG-based chart generator2005

    • 著者名/発表者名
      Hiroko Nakanishi
    • 雑誌名

      Proceedings of IWPT 2005

      ページ: 93-102

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Efficacy of Beam Thresholding, Unification Filtering and Hybrid Parsing in Probabilistic HPSG Parsing2005

    • 著者名/発表者名
      Takashi Ninomiya
    • 雑誌名

      Proceedings of IWPT 2005

      ページ: 103-114

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Biomedical Information Extraction with Predicate-Argument Structure Patterns2005

    • 著者名/発表者名
      Akane Yakushiji
    • 雑誌名

      Proceedings of the First International Symposium on Semantic Mining in Biomedicine

      ページ: 60-69

    • 関連する報告書
      2005 実績報告書
  • [雑誌論文] Deep Linguistic Analysis for the Accurate identification of Predicate-Argument Relations2004

    • 著者名/発表者名
      Yusuke Miyao, Jun'ichi Tsujii
    • 雑誌名

      In the Proceeding of COLING 2004

      ページ: 1392-1397

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] An Empirical Investigation of the Effect of Lexical Rules on Parsing with a Treebank Grammar2004

    • 著者名/発表者名
      Nakanishi Hiroko, Yusuke Miyao, Jun'ichi Tsujii
    • 雑誌名

      In the Proceeding of the third TLT2004

      ページ: 103-114

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Anchor Verbs for Biomedical IE Using Predicate-Argument Structures2004

    • 著者名/発表者名
      Yakushiji, Akane, Yuka Tateisi, Yusuke Miyao, Jun'ichi Tsujii
    • 雑誌名

      In the Companion Volume to the Proceedings of 42nd ACL

      ページ: 157-160

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] Yusuke Miyao, Jun'ichi Tsujii: "A model of syntactic disambiguation based on lexicalized grammars"Proceedings of the 7^<th> Conference on Natural Language Learning. 1-8 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Yusuke Miyao, Takashi Ninomiya, Jun'ichi Tsujii: "Probabilistic modeling of argument structures including non-local dependencies"Proceedings of the Conference on Recent Advances in Natural Language Processing. 285-291 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Yusuke Miyao, Takashi Ninomiya, Jun'ichi Tsujii: "Corpus-oriented grammar development for acquiring a Head-driven Phrase Structure Grammar from the Penn Treebank"Proceedings of the International Joint Conference on Natural Language Processing. (To appear). (2004)

    • 関連する報告書
      2003 実績報告書

URL: 

公開日: 2003-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi