• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 実績報告書

高度言語理解のための意味・知識処理の基盤技術に関する研究

研究課題

研究課題/領域番号 18002007
研究機関東京大学

研究代表者

辻井 潤一  東京大学, 大学院・情報理工学系研究科, 教授 (20026313)

キーワード言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
研究概要

意味文脈を考慮し、かつ、大規模なテキスト集合を処理する基盤技術の確立を目指した研究の最終年度として、あらたな研究成果を上げると同時に、最終的な大規模実験、および、広い研究者集団に成果を公開するためにソフトウェア・データの整備を行った。以下の研究を行った。
(1)スーバータギングの精度向上、意味の導入:局所的な情報のみを参照する従来のスーパータギングに浅い依存構造処理を統合することで、処理速度の劣化なしに精度を向上させることに成功した。現在の精度は、統合モデルよりも優れたものになっている。また、言語処理の初期段階であるタギング処理に意味を導入するモデルを構築した。
(2)事象認識システムとパスウェイモデルの統合:前年度に開発した事象認識モデルをさらに改良し現時点で世界最高の性能を示すシステムとした。このシステム(EventMine)を一般に公開した。また、認識された事象をより広範な生命事象ネットワーク(Pathway)に写像するシステムを構築した。
(3)GENIAコーパスの拡充と公開:英国マンチェスター大学、米国ヴァージニア工科大学と共同し、感染症関連の文献への意味アノテーションを行った。これは、たんぱく質関連に特化したこれまでのGENIAコーパスの範囲を大きく広げるものである。前年度に完成した32の事象アノテーションとこの感染症アノテーションを世界的に公開し、これをもとに国際的なコンペティション(BioNLP 2011)を組織した。コンペティションは、研究終了後の2011年6月に米国ポートランドで行われる。
(4)文解析を用いた機械翻訳:英語の深い文解析手法を中国語にも拡張し、中国語の深い文解析システムを完成した。この2つの文解析システムを使い、これまでのTree2Strngの統計翻訳システムをTree2treeシステムへと拡張した。また、英語と中国語の文解析システム、および、Tree2Treeの機械翻訳ソフトウェアを公開した。
(5)大規模言語処理システムの実験:前年度作成したワークフローを、英国マンチェスター大学と共同し抄録ではなく論文全文に適用する大規模な処理実験を行い、GXPが実用レベルの大規模処理に適用できることを実証した。実験では、8000以上の並列度(CPUコア数)が達成できることを確認した。

  • 研究成果

    (31件)

すべて 2011 2010 その他

すべて 雑誌論文 (19件) (うち査読あり 19件) 学会発表 (10件) 図書 (1件) 備考 (1件)

  • [雑誌論文] Effective use of Dependency Structure for Bilingual Lexicon Creation.2011

    • 著者名/発表者名
      Andrade D, Matsuzaki T, Tsujii J
    • 雑誌名

      Proceedings of the 12th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing 2011), Lecture Notes in Computer Science. 6609.

      ページ: 80-92

    • 査読あり
  • [雑誌論文] Multi-Topical Discussion Summarization using Structured Lexical Chains and Cue Words.2011

    • 著者名/発表者名
      Hatori J, Murakami A, Tsujii J
    • 雑誌名

      Proceedings of the 12th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing 2011), Lecture Notes in Computer Science. 6609.

      ページ: 313-327

    • 査読あり
  • [雑誌論文] Named Entity Recognition for Bacterial Type IV Secretion Systems.2011

    • 著者名/発表者名
      Ananiadou S, Sullivan D, Black W, Levow G-A, Gillespie JJ, Mao CH, Pyysalo S, Kolluru BK, Tsujii J, Sobral B
    • 雑誌名

      PLoS ONE

      巻: 6(3) ページ: e14780

    • 査読あり
  • [雑誌論文] Robust Measurement and Comparison of Context Similarity for Finding Translation Pairs.2010

    • 著者名/発表者名
      Andrade D, Nasukawa T, Tsujii J
    • 雑誌名

      Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010)

      ページ: 19-27

    • 査読あり
  • [雑誌論文] Evaluating Dependency Representation for Event Extraction.2010

    • 著者名/発表者名
      Miwa M, Pyysalo S, Hara T, Tsujii J
    • 雑誌名

      Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010)

      ページ: 779-787

    • 査読あり
  • [雑誌論文] Entity-Focused Sentence Simplification for Relation Extraction.2010

    • 著者名/発表者名
      Miwa M, Miyao Y, Saetre R, Tsujii J
    • 雑誌名

      Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010)

      ページ: 788-796

    • 査読あり
  • [雑誌論文] Semi-automatically Developing Chinese HPSG Grammar from the Penn Chinese Treebank for Deep Parsing.2010

    • 著者名/発表者名
      Yu K, Miyao Y, Wang XLi, Matsuzaki T, Tsujii J
    • 雑誌名

      Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010)

      ページ: 1417-1425

    • 査読あり
  • [雑誌論文] Simple and Efficient Algorithm for Approximate Dictionary Matching.2010

    • 著者名/発表者名
      Okazaki N, Tsujii J
    • 雑誌名

      Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010)

      ページ: 851-859

    • 査読あり
  • [雑誌論文] Forest-guided Supertagger Training.2010

    • 著者名/発表者名
      Zhang Y-Z, Matsuzaki T, Tsujii J
    • 雑誌名

      Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010)

      ページ: 1281-1289

    • 査読あり
  • [雑誌論文] The Gene Normalization and Intractive Systems of the University of Tokyo in the BioCreative III Challenge.2010

    • 著者名/発表者名
      Okazaki N, Cho H-C, Saetre R, Pyysalo S, Ohta T, Tsujii J
    • 雑誌名

      Proceedings of BioCreative III

      ページ: 125-130

    • 査読あり
  • [雑誌論文] Entities, Relations, Events : Representing Biomolecular Semantics.2010

    • 著者名/発表者名
      Pyysalo, Sampo
    • 雑誌名

      BMC Bioinformatics

      巻: 11(Suppl 5) ページ: 06

    • 査読あり
  • [雑誌論文] MEDIE and Info-PubMed : 2010 Update.2010

    • 著者名/発表者名
      Ohta T, Matsuzaki T, Okazaki N, Miwa M, Saetre R, Pyysalo S, Tsujii J
    • 雑誌名

      BMC Bioinformatics

      巻: 11(Suppl 5) ページ: 7

    • 査読あり
  • [雑誌論文] Text Mining Meets Workflow : Linking U-Compare with Taverna.2010

    • 著者名/発表者名
      Kano Y, Dobson P, Nakanishi M, Tsujii J, Ananiadou S
    • 雑誌名

      Bioinformatics.

      巻: 26(19) ページ: 2486-2487

    • 査読あり
  • [雑誌論文] Improving the Inter-corpora Compatibility for Protein Annotations.2010

    • 著者名/発表者名
      Wang Y, Kim J-D, Saetre R, Pyysalo S, Ohta T, Tsujii J
    • 雑誌名

      Journal of Bioinformatics and Computational Biology (JBCB)

      巻: 8(5) ページ: 901-916

    • 査読あり
  • [雑誌論文] A Re-Evaluation of Biomedical Named Entity-Term Relations.2010

    • 著者名/発表者名
      Ohta T, Pyysalo S, Kim J-D, Tsujii J
    • 雑誌名

      Journal of Bioinformatics and Computational Biology (JBCB)

      巻: 8(5) ページ: 917-928

    • 査読あり
  • [雑誌論文] Event Extraction for DNA Methylation.2010

    • 著者名/発表者名
      Ohta T, Pyysalo S, Miwa M, Tsujii J
    • 雑誌名

      Proceedings of the fourth International Symposium for Semantic Mining in Biomedicine (SMBM 2010)

      ページ: 48-56

    • 査読あり
  • [雑誌論文] An Analysis of Gene/Protein Associations at PubMed Scale.2010

    • 著者名/発表者名
      Pyysalo S, Ohta T, Tsujii J
    • 雑誌名

      Proceedings of the fourth International Symposium for Semantic Mining in Biomedicine (SMBM 2010)

      ページ: 57-65

    • 査読あり
  • [雑誌論文] Easy and Instantaneous Processing for Data-Intensive Workflows.2010

    • 著者名/発表者名
      Dun N, Taura K
    • 雑誌名

      Proceedings of the 3rd IEEE Workshop on Many-Task Computing on Grids and Supercomputers (MTAGS 2010)

      ページ: 1-10

    • 査読あり
  • [雑誌論文] Design and Implementation of GXP make---a Workflow System Based on Make.2010

    • 著者名/発表者名
      Kenjiro T, Matsuzaki T, Miwa M, Kamoshida Y, Yokoyama D, Dun N, Shibata T, Choi S-J, Tsujii J
    • 雑誌名

      Proceedings of the 2010 IEEE 6th International Conference on e-Science

      ページ: 214-221

    • 査読あり
  • [学会発表] 表現から意味へ:言語処理技術と言語の科学2011

    • 著者名/発表者名
      辻井潤一
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学(特別講演)
    • 年月日
      20110308-20110310
  • [学会発表] 日本語言語資源の統合的相互運用2011

    • 著者名/発表者名
      狩野芳伸, 橋田浩一
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] ツリーバンキングのための文法枠組みに関する考察2011

    • 著者名/発表者名
      王向莉, 松崎拓也, 宮尾祐介, Kun Yu, 李元, 辻井潤一
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] A Term Translation System Using Hierarchical Phrases and Morphemes.2011

    • 著者名/発表者名
      Wu XC, Tshjii J
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] Token Boundaries or Named Entity Boundaries.2011

    • 著者名/発表者名
      Cho H-C, Okazaki N, Tsujii J
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] 日本語格解析において問題となり得る諸現象の定量的分析2011

    • 著者名/発表者名
      花岡洋輝, 松崎拓也, 宮尾祐介, 辻井潤一
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] Getting the Deep Parse of Chinese.2011

    • 著者名/発表者名
      Yu K, Miyao Y, Matsuzaki T, Wang XLi, Tsujii J
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] 自動構築した大規模訓練データを用いた固有名抽出2011

    • 著者名/発表者名
      宇佐美佑, Cho H-C, 岡崎直観, 辻井潤一
    • 学会等名
      言語処理学会第17回年次大会
    • 発表場所
      愛知県豊橋市 豊橋技術科学大学
    • 年月日
      20110308-20110310
  • [学会発表] Computational Linguistics and Natural Language Processing2011

    • 著者名/発表者名
      Tsujii J
    • 学会等名
      the 12th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing 2011), Key Note
    • 発表場所
      早稲田大学、東京都
    • 年月日
      20110220-20110226
  • [学会発表] The Perspectives of BioNLP Shared Tasks and GENIA2010

    • 著者名/発表者名
      Tsujii J
    • 学会等名
      BioCreative III Workshop, Key Note
    • 発表場所
      Double Tree Hotel, Bethesda, Maryland, USA
    • 年月日
      20100913-20100915
  • [図書] Probabilistic Context-Free Grammars with Latent Annotations. In Srinivas Bangalore and Aravind K.Joshi (Eds.), "Supertagging-Using Complex Lexical Descriptions in Natural Language Processing."2010

    • 著者名/発表者名
      Matsuzaki, Takuya, Yusuke Miyao, Jun'ichi Tsujii.
    • 総ページ数
      337-354
    • 出版者
      MIT Press
  • [備考]

    • URL

      http://www-tsujii.is.s.u-tokyo.ac.jp/index-j.html

URL: 

公開日: 2012-07-19  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi