• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

高度言語理解のための意味・知識処理の基盤技術に関する研究

研究課題

研究課題/領域番号 18002007
研究機関東京大学

研究代表者

辻井 潤一  東京大学, 大学院・情報理工学系研究科, 教授 (20026313)

研究分担者 田浦 健次朗  東京大学, 大学院・情報理工学系研究科, 准教授 (90282714)
宮尾 祐介  東京大学, 大学院・情報理工学系研究科, 助教 (00343096)
松崎 拓也  東京大学, 大学院・情報理工学系研究科, 助教 (40463872)
キーワード言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
研究概要

本研究は、文解析研究で有効であった機械学習技術と記号処理アルゴリズムとを融合する手法を、意味・文脈・知識処理に適用することで、高度な言語処理技術の構築を目指している。このために、テキストヘの意味・文脈アノテーション付与、分野オントロジーの自動構築、意味・知識に基づく文解析手法、資源共有型の分散計算機環境の構築の研究を行う。
平成19年度は、初年度に構築した分散計算機環境の基盤を本格的な言語処理研究に活用することで、以下の研究成果を上げた。
1.意味・文脈情報のアノテーション : 初年度に第一版を構築した生命科学の事象アノテーション結果をGO、UMLS、Meshなどの標準オントロジーとリンクし、世界に公開した。また、文脈処理研究の基盤データとして、論文抄録からフルペーパに対象を拡張し、文を超えた共参照関係のアノテーションを付与した。
2.テキストからの知識抽出 : 生命科学論文からの知識抽出タスクとしてタンパク質相互作用の抽出を行い,開発中の英文解析器の結果と機械学習手法(ME)の結合で世界最高水準の抽出結果(59%)を得た。このことは,テキストから知識へ写像において深い文構造解析が有効であることを示すものとなった。
3.大域的構造の解析 : 1の結果を活用して共参照関係認識プログラムを構築し,用語意味クラスと深い構造解析の結果を活用するモデルを構築した。このモデルは,平成20年度以降の研究でさらに詳細化される文脈処理モデルの基礎となる。
4.大規模テキスト処理の計算環境 : MEDLINE抄録データベース(16百万抄録)に対して,用語意味認定,構文解析,関係抽出のすべての処理を数時間で完了できるシステムを構築した。一週間の時間と人手によるジョブ管理が数時間の自動処理に置き換えられたことは,本プロジェクトの大きな成果である。
5.機械翻訳の予備実験 : 意味・知識処理の研究成果を統合する日中機械翻訳システムのプロトタイプを構築.特に専門用語の意味辞書を自動構築する実験を行い,すぐれた結果を得た。

  • 研究成果

    (37件)

すべて 2008 2007 その他

すべて 雑誌論文 (35件) (うち査読あり 34件) 学会発表 (1件) 備考 (1件)

  • [雑誌論文] Corpus annotation for mining biomedical events from literature.2008

    • 著者名/発表者名
      Kim, J-D, T Ohta and J Tsujii
    • 雑誌名

      BMC Bioinformatics 9(1)

      ページ: 10

    • 査読あり
  • [雑誌論文] New challenges for text mining : Mappign between text and manually curated pathways.2008

    • 著者名/発表者名
      Oda, K, J-D Kim, T Ohta, D Okanohara, T Matsuzaki, Y Tateisi and J Tsujii
    • 雑誌名

      BMC Bioinformatics 9(Suppl 3)

      ページ: S5

    • 査読あり
  • [雑誌論文] Feature Forest Models for Probabilistic HPSG Parsing.2008

    • 著者名/発表者名
      Miyao, Y and J Tsujii
    • 雑誌名

      Computational Linguistics 34(1)

      ページ: 35-80

    • 査読あり
  • [雑誌論文] Syntactic features for protein-protein interaction extraction.2008

    • 著者名/発表者名
      Saetre, R, K Sagae and J Tsujii
    • 雑誌名

      Short Paper Proceedings of the 2nd International Symposium on Languages in Biology and Medicine (LBM 2007)

      ページ: 6.1-6.14

    • 査読あり
  • [雑誌論文] BI-018 Path Text : Text Mining Tools Integrated with Biological Pathway.2008

    • 著者名/発表者名
      Saetre, R. B Kemper, K Oda, N Okazaki, Y Matsuoka, N Kikuchi, H Kitano, Y Tsuruoka, S Ananiadou and J Tsujii
    • 雑誌名

      Genomes to Systems Conference 2008 Handbook

      ページ: 65

    • 査読あり
  • [雑誌論文] Task-Oriented Evaluation of Syntactic Parsers and Their Representations.2008

    • 著者名/発表者名
      Miyao Y, R Saetre, K Sagae, T Matsuzaki and J Tsujii
    • 雑誌名

      Proceedings of ACl-08 : HLT

      ページ: 46-54

    • 査読あり
  • [雑誌論文] A Comparison of Knowledge Resource Designs : Supporting Term-level Text Annotation.2008

    • 著者名/発表者名
      Tribble A, J-D Kim, T Ohta and J Tsujii
    • 雑誌名

      Proceedings of LREC-2008 Workshop : Building and evaluating resources for biotext mining.

    • 査読あり
  • [雑誌論文] Building a Bilingual Lexicon Using Phrase-based Statistical Machine Translation via a Pivot Language.2008

    • 著者名/発表者名
      Tsunakawa, T, N Okazaki and J Tsujii
    • 雑誌名

      Proceedings of The 22nd International Conference on Computational Linguistics Companion volume Posters and Demonstrations.

      ページ: 127-130

    • 査読あり
  • [雑誌論文] Filling the Gaps Between Tools and Users : A Tool Comparator, Using Protein-Protein Interactions as an Example.2008

    • 著者名/発表者名
      Kano, Y, N Nguyen, R Saetre, K Yoshida, Y Miyao, Y Tsuruoka, Y Matsubayashi, S Ananiadou and J Tsujii
    • 雑誌名

      Proceedings of The Pacific Symposium on Biocomputing (PSB)

      ページ: 616-627

    • 査読あり
  • [雑誌論文] Exact Inference for Multi-label Classification using Sparse Graphical Models.2008

    • 著者名/発表者名
      Miyao, Y and J Tsujii
    • 雑誌名

      Proceedings of the 22nd International Conference on Computational Linguistics Poser Session.

      ページ: 63-66

    • 査読あり
  • [雑誌論文] Word Sense Disambiguation for All Words using Tree-Structured Conditional Random Fields.2008

    • 著者名/発表者名
      Hatori, J, Y Miyao and J Tsujii
    • 雑誌名

      Proceedings of the 22nd International Conference on Computational Linguistics Poster Session.

      ページ: 43-46

    • 査読あり
  • [雑誌論文] Towards Data And Goal Oriented Analysis : Tool Inter-Operability And Combinatorial Comparison.2008

    • 著者名/発表者名
      Kano, Y, N Nguyen, R Saetre, K Yoshida, K Fukamachi, Y Miyao, Y Tsuruoka, S Ananiadou and J Tsujii
    • 雑誌名

      Proceedings of the 3rd International Joint Conference on Natural Language Processin. Hyderabad, India

      ページ: 859-864

    • 査読あり
  • [雑誌論文] Bilingual Synonym Identification with Spelling Variations.2008

    • 著者名/発表者名
      Tsunakawa, T and J Tsujii
    • 雑誌名

      Proceedins of the 3rd international Joint Conference on Natural Language Processing. Hyderabad, India

      ページ: 457-464

    • 査読あり
  • [雑誌論文] GENIA-GR : a Grammatical Relation Corpus for Parser Evaluation in the Biomedical Domain.2008

    • 著者名/発表者名
      Tateisi, Y, Y Miyao, K Sagae and J Tsujii
    • 雑誌名

      Proceedins of the 5th International Conference on Language Resources and Evaluation.

      ページ: 496

    • 査読あり
  • [雑誌論文] Building Bilingual Lexicons Using Lexical Translation Probabilities via Pivot Languages.2008

    • 著者名/発表者名
      Tsunekawa, T, N Okazaki and J Tsujii
    • 雑誌名

      Proceedings of the 5th International Conference on Language Resources and Evaluation.

    • 査読あり
  • [雑誌論文] From Text to Pathway : Corpus Annotation for Knowledge Acquisition from Biomedical Literature.2008

    • 著者名/発表者名
      Kim, J-D, T Ohta, K Oda, and J Tsujii
    • 雑誌名

      proceedings of the 6th Aisa Pcific Bioinformatics Conference. Series on Advances in Bioinformatics and Computational Biology6.

      ページ: 165-176

    • 査読あり
  • [雑誌論文] Challenges in Pronoun Resolution System for Biomedical Text.2008

    • 著者名/発表者名
      Nagan, N, J-D Kim and J Tsujii
    • 雑誌名

      proceedings of the 6th editoin of the Language Resources and Evaluation.

    • 査読あり
  • [雑誌論文] Raising the Compatibility of Heterogeneous Annotations : A Case Study on Protein Mention Recognition.2008

    • 著者名/発表者名
      Wang, Y, K Yoshida, J-D Kim, R Saetre and J Tsujii
    • 雑誌名

      Proceedings of the BioNLP workshop of the 46th Annual Meeting of the Association for Computational Linguistics (ACL 2008). BioNLP 2008. Current Trends in Biomedical Natural Language.

      ページ: 118-119

    • 査読あり
  • [雑誌論文] Comparative Parser Performance Analysis across Grammar Frameworks through Automatic Tree Conversion using Synchronous Grammars.2008

    • 著者名/発表者名
      Matsuzaki, T and J Tsujii
    • 雑誌名

      Proceedings of the 22nd International Conference on Computational Linguistics (COLING-2008)

      ページ: 545-552

    • 査読あり
  • [雑誌論文] SB-012 'PAYAO' : Web community tagging system to SBML models.2008

    • 著者名/発表者名
      Matsuoka, Y, N Kikuchi, R Saetre, B Kemper, N Okazaki, H Sugimura, A Hayama, S Ananiadou J Tsujii and H Kitano
    • 雑誌名

      Genomes to Systems Conference 2008 Handbook

      ページ: 91

    • 査読あり
  • [雑誌論文] Sharable type system design for tool inter-operability and combinatorial comparison.2008

    • 著者名/発表者名
      Kano, Y, N Nguyen, R Saetre, K Fukamachi, K Yoshida, Y Miyao, Y Tsuruoka, S Ananiadou and J Tsujii
    • 雑誌名

      Proceedings of the First International Conferene on Global Interoperability for Language Resources (ICGL)

      ページ: 122-129

    • 査読あり
  • [雑誌論文] Challenges in Mapping of Syntactic Representations for Framework-Independent Parser Evaluation.2008

    • 著者名/発表者名
      Sagae, K, Y Miyao, T Matsuzaki and J Tsujii
    • 雑誌名

      Proceedings of the Workshop on Automated Syntactic Annotations for Interoperable Language Resources at the First International Conference on Global Interoperability for Language Resources (ICGL'08)

    • 査読あり
  • [雑誌論文] Machine Learning-Based Pronoun Resolution for Biomedical Text.2008

    • 著者名/発表者名
      Nguyen, N, Miyao, J-D Kim and J Tsujii
    • 雑誌名

      言語処理学会第14回年次大会発表論文集(NLP2008)

  • [雑誌論文] 複雑なグリッド環境で柔軟なプログラミングを実現するフレームワーク.2008

    • 著者名/発表者名
      弘中健, 斎藤秀雄, 高橋慧, 田浦健次朗
    • 雑誌名

      情報処理学会論文誌 : コンピューティングシステム(ACS) 1(2)

      ページ: 157-168

    • 査読あり
  • [雑誌論文] gluepy : A Simple Distributed Python Framework for Complex Grid Environments.2008

    • 著者名/発表者名
      Hironaka, K. H Saito, K Takahashi and K Taura
    • 雑誌名

      Proceedings of the 21st Annual International Works hop on Languages and Compilers for Parallel Gomputing (LCPC 2008)

      ページ: 249-263

    • 査読あり
  • [雑誌論文] Learning string similarity measures for gene/protein name dictionary look-up using logistic regression.2007

    • 著者名/発表者名
      Tsuruoka, Y, J McNaught, J Tsujii and S Ananiadou
    • 雑誌名

      Bioinformatics 23(20)

      ページ: 2768-2774

    • 査読あり
  • [雑誌論文] Move Prediction in Go with the Maximum Entropy Method.2007

    • 著者名/発表者名
      Araki, N, K Yoshida, Y Tsuruoka and J Tsujii
    • 雑誌名

      IEEE Symposium Series on Computational Intelligence

      ページ: 189-195

    • 査読あり
  • [雑誌論文] Framework independent summarized parser output and its documentation.2007

    • 著者名/発表者名
      Tam, WL, Y Miyao and J Tsujii
    • 雑誌名

      Proceeding of grammar engineering across framework 2007

      ページ: 319-331

    • 査読あり
  • [雑誌論文] Towards Framework-Independent Evaluation of Deep Linguistic Parsers.2007

    • 著者名/発表者名
      Miyao, Y, K Sagae and J Tsujii
    • 雑誌名

      Proceedings of Grammar Engineering across Frameworks 2007

      ページ: 238-258

    • 査読あり
  • [雑誌論文] A log-linear model with an n-gram reference distribution for accurate HPSG parsing.2007

    • 著者名/発表者名
      Ninomiya, T, Takuya M, Y Miyao and J Tsujii
    • 雑誌名

      Proceedings of IWPT 2007

      ページ: 60-68

    • 査読あり
  • [雑誌論文] Evaluating Impact of Re-training a Lexical Disambiguation Model on Domain Adaptation of an HPSG Parser.2007

    • 著者名/発表者名
      Hara, T, Y Miyao and J Tsujii
    • 雑誌名

      Proceedings of IWPT 2007

      ページ: 11-22

    • 査読あり
  • [雑誌論文] HPSG parsing with shallow dependency constraints.2007

    • 著者名/発表者名
      Sagae, K, Y Miyao and J Tsujii
    • 雑誌名

      Proceedings of the 44th Meeting of the Association for Computational Linguistics

      ページ: 624-631

    • 査読あり
  • [雑誌論文] A discriminative language model with pseudo-negative samples.2007

    • 著者名/発表者名
      Okanohara, D and J Tsujii
    • 雑誌名

      Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics

      ページ: 73-80

    • 査読あり
  • [雑誌論文] AKANE System : Protein-Protein Interaction Pairs in BioCreAtlvE2 Challenge, PPI-IPS subtask.2007

    • 著者名/発表者名
      Saetre, R, K Yoshida, A Yakushiji, Y Miyao, Y Matsubayashi and T Ohta
    • 雑誌名

      Proceedings of the Second BioCreative Challenge Evaluation Workshop

      ページ: 209-212

    • 査読あり
  • [雑誌論文] Reranking for Biomedical Named-Entity Recognition.2007

    • 著者名/発表者名
      Yoshida, K and J Tsujii
    • 雑誌名

      Proceedings of the Workshop on BioNLP 2007

      ページ: 215-222

    • 査読あり
  • [学会発表] 広域TCPオーバレイにおけるデッドロックフールーティング.2008

    • 著者名/発表者名
      弘中健, 斎藤秀雄, 田浦健次朗
    • 学会等名
      情報処理学会研究報告OS-109(SWoPP2008)
    • 発表場所
      佐賀市
    • 年月日
      2008-08-05
  • [備考]

    • URL

      http://www-tsujii.is.s.u-tokyo.ac.jp/indes-j.html

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi