• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Approach to inverse sequence alignment with conditional random fields and its application to information extraction

Research Project

Project/Area Number 18700148
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionNara Institute of Science and Technology

Principal Investigator

SHIMBO Masashi  Nara Institute of Science and Technology, 情報科学研究科, 助教授 (90311589)

Project Period (FY) 2006 – 2008
Project Status Completed (Fiscal Year 2008)
Budget Amount *help
¥3,800,000 (Direct Cost: ¥3,500,000、Indirect Cost: ¥300,000)
Fiscal Year 2008: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2007: ¥1,200,000 (Direct Cost: ¥1,200,000)
Fiscal Year 2006: ¥1,300,000 (Direct Cost: ¥1,300,000)
Keywordsテキストマイニング / 情報抽出 / 並列句解析 / 系列アラインメント / 自然言語処理 / アラインメント / 構文解析 / 医学文献 / 並列句
Research Abstract

条件付き確率場の近似法である平均化パーセプトロン学習を用いて逆系列アラインメント(inverse parametric sequence alignment)問題を解くための手法を提案した.逆系列アラインメントとはすなわち,与えられた訓練データから編集コストモデルを学習する問題である.応用として生物学文書(英語)および日本語(百科辞典および新聞記事)からの並列句検出および範囲同定に適用し,既存法に比べて高い精度を得た.タグ付け(教師データ)が不十分な場合でも対処するために2種類のヒューリスティックを提案し,その有効性を実証した.

Report

(4 results)
  • 2008 Annual Research Report   Final Research Report ( PDF )
  • 2007 Annual Research Report
  • 2006 Annual Research Report
  • Research Products

    (28 results)

All 2009 2008 2007 2006 Other

All Journal Article (9 results) (of which Peer Reviewed: 4 results) Presentation (16 results) Book (2 results) Remarks (1 results)

  • [Journal Article] アラインメントと機械学習を応用した並列句解析:医学生物学論文からの情報抽出に向けて2008

    • Author(s)
      原一夫, 新保仁, 松本裕治
    • Journal Title

      人工知能学会論文誌 22

      Pages: 248-255

    • NAID

      10022007476

    • Related Report
      2007 Annual Research Report
    • Peer Reviewed
  • [Journal Article] アラインメントと機械学習を応用した並列句解析 : 医学生物学論文からの情報抽出に向けて2007

    • Author(s)
      原一夫, 新保仁, 松本裕治
    • Journal Title

      人工知能学会論文誌 Vol.22, No.3

      Pages: 248-255

    • NAID

      10022007476

    • Related Report
      2008 Final Research Report
    • Peer Reviewed
  • [Journal Article] コミュニティを考慮したカーネル引用解析2007

    • Author(s)
      伊藤敬彦, 新保仁, 持橋大地, 松本裕治
    • Journal Title

      電気電子通信情報学会論文誌D Vol.J90-D, No.2

      Pages: 233-244

    • NAID

      110007380656

    • Related Report
      2008 Final Research Report
    • Peer Reviewed
  • [Journal Article] コミュニティを考慮したカーネル引用解析2007

    • Author(s)
      伊藤, 新保, 持橋, 松本
    • Journal Title

      電子情報通信学会論文誌 D Vol.J90-D No.2

      Pages: 233-244

    • NAID

      110007380656

    • Related Report
      2006 Annual Research Report
  • [Journal Article] カーネルリンク解析におけるパラメタ依存性と近似計算について2006

    • Author(s)
      新保仁, 伊藤敬彦, 松本裕治
    • Journal Title

      日本データベース学会 Letters (DBSJ Letters) Vol.5, No.2

      Pages: 101-104

    • NAID

      40015217383

    • Related Report
      2008 Final Research Report
    • Peer Reviewed
  • [Journal Article] カーネルリンク解析におけるパラメタ依存性と近似計算について2006

    • Author(s)
      新保, 伊藤, 松本
    • Journal Title

      日本データベース学会Letters Vol. 5 No. 2

      Pages: 101-104

    • NAID

      40015217383

    • Related Report
      2006 Annual Research Report
  • [Journal Article] 部分アラインメント同定を応用した並列句解析2006

    • Author(s)
      原, 新保, 松本
    • Journal Title

      Proceedings of the International Workshop on Data-Mining and Statistical Science

      Pages: 167-172

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Exploring Multiple Communities with Kernel-Based Link Analysis2006

    • Author(s)
      T.Ito, M.Shimbo, D.Mochihashi, Y.Matsumoto
    • Journal Title

      Proceedings of the 10th European Conference on Principles and Practice of Knowledge Discovery in Databases (PKDD) LNAI 4213

      Pages: 235-246

    • Related Report
      2006 Annual Research Report
  • [Journal Article] Investigating the effect of multiple communities on kernel-based citation analysis2006

    • Author(s)
      T.Ito, M.Shimbo, D.Mochihashi, Y.Matsumoto
    • Journal Title

      Proceedings of the Second International Special Workshop on Databases for Next-Generation Researchers (SWOD 2006)

    • Related Report
      2006 Annual Research Report
  • [Presentation] バイパス付き編集グラフを用いた日本語並列構造解析2009

    • Author(s)
      大熊秀治, 新保仁, 原一夫, 松本裕治
    • Organizer
      情報処理学会研究報告, 自然言語処理研究会2009-NL-190
    • Place of Presentation
      東京
    • Year and Date
      2009-03-26
    • Related Report
      2008 Annual Research Report
  • [Presentation] バイパス付き編集グラフを用いた日本語並列構造解析2009

    • Author(s)
      大熊秀治, 新保仁, 原一夫, 松本裕治
    • Organizer
      情報処理学会研究報告 自然言語処理研究会
    • Related Report
      2008 Final Research Report
  • [Presentation] GEMAコーパスからのネスト並列句同定2008

    • Author(s)
      原一夫, 新保仁, 大熊秀治, 松本裕治
    • Organizer
      情報処理学会研究報告, 自然言語処理研究会2008-NL-187
    • Place of Presentation
      熱海
    • Year and Date
      2008-09-24
    • Related Report
      2008 Annual Research Report
  • [Presentation] A Family of Dissimilarity Measures between Nodes Generalizing Both the Shortest-Path and the Commute-time Distances2008

    • Author(s)
      Yen, Mantrach, Saerens, Shimbo
    • Organizer
      ACM SIGKDD Conference
    • Place of Presentation
      Las Vegas, USA
    • Year and Date
      2008-08-26
    • Related Report
      2008 Annual Research Report
  • [Presentation] 機械学習と系列アラインメントを応用した日本語並列句解析2008

    • Author(s)
      大熊秀治, 新保仁, 原一夫, 松本裕治
    • Organizer
      008年度人工知能学会全国大会(第22回)
    • Place of Presentation
      旭川
    • Year and Date
      2008-06-11
    • Related Report
      2008 Annual Research Report
  • [Presentation] A family of dissimilarity measures between nodes generalizing both the shortest path and the commute-time distances.2008

    • Author(s)
      L. イェン, M. サレンス, A. マントラック, 新保仁
    • Organizer
      In Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2008)
    • Place of Presentation
      Las Vegas, USA.
    • Related Report
      2008 Final Research Report
  • [Presentation] 機械学習と系列アラインメントを応用した日本語並列句解析2008

    • Author(s)
      大熊秀治, 原一夫, 新保仁, 松本裕治
    • Organizer
      2008年度人工知能学会全国大会(第22回)論文集
    • Place of Presentation
      旭川
    • Related Report
      2008 Final Research Report
  • [Presentation] カーネル法を用いた意味的類似度の定義とブートストラップの一般化2008

    • Author(s)
      小町守, 工藤拓, 新保仁, 松本裕治
    • Organizer
      言語処理学会第14回年次大会論文集
    • Place of Presentation
      東京
    • Related Report
      2008 Final Research Report
  • [Presentation] Generic Text Summarization Using Probabilistic Latent Semantic Indexing.2008

    • Author(s)
      H. バンダリ, 新保仁, 伊藤敬彦, 松本裕治
    • Organizer
      In Proceedings of the Third International Joint Conference on Natural Language Processing (IJCNLP 2008)
    • Place of Presentation
      Hyderabad, India
    • Related Report
      2008 Final Research Report
  • [Presentation] Generic Text Summarization Using Probabilistic Latent Semantic Indexing2008

    • Author(s)
      H. Bhandari, M. Shimbo, T. Ito, Y. Matsumoto
    • Organizer
      Interntional Joint Conference on Natural Language Processing
    • Place of Presentation
      Hyderabad, India
    • Related Report
      2007 Annual Research Report
  • [Presentation] カーネル法を用いた意味的類似度の定義とブートストラップの一般化2008

    • Author(s)
      小町守, 工藤拓, 新保仁, 松本裕治
    • Organizer
      言語処理額会第14回年次大会
    • Place of Presentation
      東京
    • Related Report
      2007 Annual Research Report
  • [Presentation] カーネル法によるリンク・引用解析2007

    • Author(s)
      新保仁
    • Organizer
      人工知能学会基本問題研究会(第66回)予稿集
    • Place of Presentation
      湯布院
    • Related Report
      2008 Final Research Report
  • [Presentation] カーネル法によるリンク・引用解析2007

    • Author(s)
      新保仁
    • Organizer
      人工知能学会・人工知能基本問題研究会
    • Place of Presentation
      湯布院
    • Related Report
      2007 Annual Research Report
  • [Presentation] 部分アラインメント同定を応用した並列句解析2006

    • Author(s)
      原一夫, 新保仁, 松本裕治
    • Organizer
      In Proceedings of the First International Workshop on Data-Mining and Statistical Science (DMSS 2006)
    • Place of Presentation
      札幌
    • Related Report
      2008 Final Research Report
  • [Presentation] Exploring multiple communities with kernel-based citation analysis.2006

    • Author(s)
      伊藤敬彦, 新保仁, 持橋大地, 松本裕治
    • Organizer
      In Proceedings of the Principles and Practice of Knowledge Discovery in Databases (PKDD 2006), Lecture Notes in Artificial Intelligence
    • Place of Presentation
      Berlin, Germany
    • Related Report
      2008 Final Research Report
  • [Presentation] Investigating the effect of multiple communities on kernel-based citation analysis.2006

    • Author(s)
      伊藤敬彦, 新保仁, 持橋大地, 松本裕治
    • Organizer
      In Proceedings of the Second International Special Workshop on Databases for Next-Generation Researchers (SWOD 2006)
    • Place of Presentation
      Atlanta, USA
    • Related Report
      2008 Final Research Report
  • [Book] Kernels for link analysis. In Mining Graph Data2006

    • Author(s)
      新保仁, 伊藤敬彦
    • Publisher
      John Wiley & Sons
    • Related Report
      2008 Final Research Report
  • [Book] Mining Graph Data, Chapter 12 Kernels as Link Analysis Measures (pp. 283-310) (D. Cook and L. Holder (eds.))2006

    • Author(s)
      M.Shimbo, T.Ito
    • Total Pages
      28
    • Publisher
      John Wiley & Sons
    • Related Report
      2006 Annual Research Report
  • [Remarks]

    • URL

      http://cl.naist.jp/project/coordination

    • Related Report
      2008 Final Research Report

URL: 

Published: 2006-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi