• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2009 Fiscal Year Annual Research Report

高度言語理解のための意味・知識処理の基盤技術に関する研究

Research Project

Project/Area Number 18002007
Research InstitutionThe University of Tokyo

Principal Investigator

辻井 潤一  東京大学, 大学院・情報理工学系研究科, 教授 (20026313)

Keywords言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
Research Abstract

意味文脈を考慮し、かつ、大規模なテキスト集合を処理する基盤技術の確立を目指して、以下の研究成果を上げた。
(1)スーパータギングを中核にした文解析モデル:素性文法のためのスーパータギングの技術を開発し、段階的な文解析モデルを構築した。このモデルは、統合的な統計モデルに比べ、5倍から7倍の処理速度を持つことを確認した。
(2)生命事象認識システム:文解析の結果を素性として使い、従来の木構造カーネルと同様な精度をもち、かつ、高速度の認識ができるSVM分類器を作成し、これを文献からの生命事象認識システムに適用した。このシステムは、処理速度だけでなく、精度面でも国際コンペティション(ACL BioNLP)で24チーム中2位の性能を示した。
(3)意味・文脈コーパスの拡充:GENIAコーパスの事象アノテーションを9クラスの事象から32クラスに拡張し、生命オントロジー(GO)におけるたんぱく質関連の事象分類をすべて覆う作業が完了した。また、たんぱく質の共参照関係に特化して、参照関係アノテーションの質の向上を図った。
(4)文解析を活用する機械翻訳システム:これまでの統計的機械翻訳は、文の構造的な側面を捨象するか、あるいは、非常にアドホックで浅い手法で文の構造を翻訳モデルに統合していた。これに対して、深い文解析の結果を使う統計モデルを開発し、従来モデルのBlue値を2以上改善することに成功した。
(5)大規模クラスターを活用した言語処理ワークフロー:Unixで使われるmakeをそのまま大規模な分散環境で使うことができるワークフロー記述言語(GXP)を開発し、これを使って、文境界認識・品詞付・文解析・固有名認識・事象認識.意味インデキシングという複雑な言語処理ワークフローを記述し、その自動実行が可能なことを大規模な実験(Medlineの1000万抄録の処理)で実証した。

  • Research Products

    (30 results)

All 2010 2009 Other

All Journal Article (21 results) (of which Peer Reviewed: 20 results) Presentation (7 results) Book (1 results) Remarks (1 results)

  • [Journal Article] Event Extraction with Complex Event Classification Using Rich Features.2010

    • Author(s)
      Miwa M, Saetre R, Kim J-D, Tsujii J
    • Journal Title

      Journal of Bioinformatics and Computational Biology (JBCB)

      Volume: 8(1) Pages: 131-146

    • Peer Reviewed
  • [Journal Article] DMI:計算資源の動的な参加/脱退をサポートする大規模分散共有メモリインターフェース2010

    • Author(s)
      原健太朗, 田浦健次朗, 近山隆
    • Journal Title

      情報処理学会論文誌:プログラミング

      Volume: 3(1) Pages: 1-40

  • [Journal Article] Comparison of Chinese Treebanks for Corpus-oriented HPSG Grammar Development.2010

    • Author(s)
      Yu K, Miyao Y, Matsuzaki T, Wang XLi, Zhang YZ, Uchimoto K, Tsujii J
    • Journal Title

      Journal of Natural Language Processing (Special Issue on Empirical Methods for Asian Language Processing)

      Volume: 17(3) Pages: 61-80

    • Peer Reviewed
  • [Journal Article] Building a High Quality Sense Inventory for Improved Abbreviation Disambiguation.2010

    • Author(s)
      Okazaki N, Ananiadou S, Tsujii J
    • Journal Title

      Bioinformatics

      Volume: 26(9) Pages: 1246-1253

    • Peer Reviewed
  • [Journal Article] Disambiguating the Species of Biomedical Named Entities Using Natural Language Parsers.2010

    • Author(s)
      Wang XLong, Tsujii J, Ananiadou S
    • Journal Title

      Bioinformatics

      Volume: 26(5) Pages: 661-667

    • Peer Reviewed
  • [Journal Article] A Japanese Particle Corpus Built by Example-Based Annotation.2010

    • Author(s)
      Hanaoka H, Mima H, Tsujii J
    • Journal Title

      Proceedings of the Seventh Conference on International Language Resources and Evaluation (LREC'10)

      Pages: 1876-1880

    • Peer Reviewed
  • [Journal Article] U-Compare : An integrated language resource evaluation platform including a comprehensive UIMA resource library.2010

    • Author(s)
      Kano Y, Dorado R, McCrohon L, Ananiadou S, Tsujii J
    • Journal Title

      Proceedings of the Seventh Conference on International Language Resources and Evaluation (LREC'10)

      Pages: 428-434

    • Peer Reviewed
  • [Journal Article] A Simple Approach for HPSG Supertagging Using Dependency Information.2010

    • Author(s)
      Zhang YZ, Matsuzaki T, Tsujii J
    • Journal Title

      Proceedings of 11th Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT'10)

    • Peer Reviewed
  • [Journal Article] PathText : a Text Mining Integrator for Biological Pathway Visualizations.2010

    • Author(s)
      Kemper B, Matsuzaki T, Matsuoka Y, Tsuruoka Y, Kitano H, Ananiadou S, Tsujii J
    • Journal Title

      Bioinformatics

      Volume: 26(12) Pages: i374-i381

    • Peer Reviewed
  • [Journal Article] Improve Syntax-based Translation Using Deep Syntactic Structures.2010

    • Author(s)
      Wu XC, Matsuzaki T, Tsujii J
    • Journal Title

      Machine Translation (Special Issue : Pushing the frontiers of SMT)

      Volume: 24(2) Pages: 141-157

    • Peer Reviewed
  • [Journal Article] ParaTrac : A Fine-Grained Profiler for Data-Intensive Work flows2010

    • Author(s)
      Dun N, Taura K, Yonezawa A
    • Journal Title

      Proceedings of the 19th ACM International Symposium on High Performance Distributed Computing (HPDC 2010)

      Pages: 37-48

    • Peer Reviewed
  • [Journal Article] File-Access Patterns of Data-Intensive Workflow Applications and their Implications to Distributed Filesystems.2010

    • Author(s)
      Shibata T, Choi SJ, Taura K
    • Journal Title

      Proceedings of the Third International Workshop on Data Intensive Distributed Computing (DIDC 2010)

      Pages: 746-755

    • Peer Reviewed
  • [Journal Article] Event Extraction for Systems Biology by Text Mining the Literature.2010

    • Author(s)
      Ananiadou S, Pyysalo S, Tsujii J, Kell DB
    • Journal Title

      Trends in Biotechnology

      Volume: 28(7) Pages: 381-390

    • Peer Reviewed
  • [Journal Article] Extracting Protein-Interactions from Text with the Unified AkaneRE Event Extraction System.2010

    • Author(s)
      Saetre R, Yoshida K, Miwa M, Matsuzaki T, Kano Y, Tsujii J
    • Journal Title

      Transactions on Computational Biology and Bioinformatics (TCBB), BioCreative II. 5 Special Issue.

      Volume: 7 Pages: 46

    • Peer Reviewed
  • [Journal Article] Fine-Grained Tree-to-String Translation Rule Extraction.2010

    • Author(s)
      Wu XC, Matsuzaki T, Tsujii J
    • Journal Title

      Proceedings of The 48th Annual Meeting of the Association for Computational Linguistics (ACL 2010)

      Pages: 325-334

    • Peer Reviewed
  • [Journal Article] Event Extraction for Post-Translational Modifications.2010

    • Author(s)
      Ohta T, Pyysalo S, Miwa M, Kim J-D, Tsujii J
    • Journal Title

      Proceedings of the 2010 Workshop on Biomedlcal Natural Language Processing (BioNLP2010)

      Pages: 19-27

    • Peer Reviewed
  • [Journal Article] A Comparative Study of Syntactic Parsers for Event Extraction.2010

    • Author(s)
      Miwa M, Pyysalo S, Hara T, Tsujii J
    • Journal Title

      Proceedings of the 2010 Workshop on Biomedical Natural Language Processing (BioNLP2010)

      Pages: 37-45

    • Peer Reviewed
  • [Journal Article] Towards Event Extraction from Full Texts on Infectious Diseases.2010

    • Author(s)
      Pyysalo S, Ohta T, Cho H-C, Sullivan D, Mao CH, Sobral B, Tsujii J, Ananiadou S
    • Journal Title

      Proceedings of the 2010 Workshop on Biomedical Natural Language Processing (BioNLP2010)

      Pages: 132-140

    • Peer Reviewed
  • [Journal Article] The Deep Re-Annotation in a Chinese Scientific Treebank.2010

    • Author(s)
      Yu K, Wang XLi, Miyao Y, Matsuzaki T, Tsujii J
    • Journal Title

      Proceedings of the 4th Linguistic Annotation Workshop

      Pages: 123-126

    • Peer Reviewed
  • [Journal Article] On Contribution of Sense Dependencies to Word Sense Disambiguation.2009

    • Author(s)
      Hatori J, Miyao Y, Tsujii J
    • Journal Title

      Journal of Natural Language Processing

      Volume: 16(5) Pages: 51-77

    • Peer Reviewed
  • [Journal Article] Investigating Heterogeneous Protein Annotations toward Cross-Corpora Utilization.2009

    • Author(s)
      Wang Y, Kim J-D, Saetre R, Pyysalo S, Tsujii J
    • Journal Title

      BMC Bioinformatics

      Volume: 10(403)

    • Peer Reviewed
  • [Presentation] 言語理解と知識-情報空間の構造化に向けて-2010

    • Author(s)
      辻井潤一
    • Organizer
      第24回人工知能学会全国大会
    • Place of Presentation
      長崎市長崎ブリックホール(基調講演)
    • Year and Date
      20100609-20100611
  • [Presentation] Deep Syntactic Structures for String-to-Tree Translation.2010

    • Author(s)
      Wu, Xianchao, Jun'ichi Tsujii
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京都東京大学
    • Year and Date
      20100309-20100311
  • [Presentation] 構文解析の分野適応における精度低下要因の分析及び分野間距離の測定手法2010

    • Author(s)
      張本佳子, 宮尾祐介, 辻井潤一
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京都東京大学
    • Year and Date
      20100309-20100311
  • [Presentation] 行列分解による多クラス分類とその応用2010

    • Author(s)
      岡野原大輔, 辻井潤一
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京都東京大学
    • Year and Date
      20100309-20100311
  • [Presentation] 大語彙の同義語集合からの文脈に応じた語彙選択2010

    • Author(s)
      松原勇介, 辻井潤一
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京都東京大学
    • Year and Date
      20100309-20100311
  • [Presentation] A Constrained Semantics for Parsed English Sentences.2010

    • Author(s)
      Butler A, Miyao Y, Yoshimoto K, Tsujii J
    • Organizer
      言語処理学会第16回年次大会
    • Place of Presentation
      東京都東京大学
    • Year and Date
      20100309-20100311
  • [Presentation] Bilingual Dictionary Extraction from Wikipedia.2009

    • Author(s)
      Yu K, Tsujii J
    • Organizer
      Proceedings of Machine Translation Summit XII
    • Place of Presentation
      シャトーロリエ、オタワ(カナダ)
    • Year and Date
      20090826-20090830
  • [Book] Evaluating the Impact of Re-training a Lexical Disambiguation Model on Domain Adaptation of an HPSG Parser. In Harry Bunt, Paola Merlo, Joakim Nivre (Eds.), "Trends in Parsing Technology : Dependency Parsing, Domain Adaptation, and Deep Parsing. Text, Speech and Language Technology."2009

    • Author(s)
      Hara T, Miyao Y, Tsujii J
    • Total Pages
      253-272
    • Publisher
      Springer
  • [Remarks]

    • URL

      http://www-tsujii.is.s.u-tokyo.ac.jp/index-j.html

URL: 

Published: 2012-07-19  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi