• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Annual Research Report

高度言語理解のための意味・知識処理の基盤技術に関する研究

Research Project

Project/Area Number 18002007
Research InstitutionThe University of Tokyo

Principal Investigator

辻井 潤一  The University of Tokyo, 大学院・情報理工学系研究科, 教授 (20026313)

Keywords言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
Research Abstract

本研究は、機械学習技術と記号処理アルゴリズムとを融合した手法を、意味・文脈・知識処理に適用することで、高度な言語処理技術の構築をめざしている。このために、本格的な意味知識処理を含む高度言語処理にとって必要な3つの基盤、(1) 構造に関する理論と確率・機械学習の理論を有機的に統合した理論、(2) 大規模な意味・知識リソース、(3) 大規模データを処理する計算環境を確立した上で、(4) 意味・知識処理技術の研究を系統的に行うことを目的としている。また、研究成果の有効性を実証できる応用システムとして、(5) 生命科学分野のテキストマイニングと高品質機械翻訳のシステムの開発を同時進行的に行なっている。平成20年度は、以下の研究をおこなった。
1. 深い文解析と意味知識処理:深い文解析を本格的な情報抽出(タンパク質相互作用の抽出)に適用し、従来のシステムの精度を格段に向上させた。深い解析が情報抽出に有効との結果を世界で最初に実証した。
2. 系列tagging学習器:隠れ変数を使った機械学習を言語処理へ適用し、深い文解析の速度を20倍向上させるとともに、固有名認識などの意味処理タスクでも、世界最高水準のパフォーマンスを達成した。
3. GENIAコーパス:構築したGENIAコーパスは、これを使った国際コンペティションに24チームが参加するなど、生命科学分野でのデ・ファクトの国際標準となっている。
4. U-Compare:言語処理ソフトウェア共有枠組み(U-Compare)は、世界で最大(組み込みツール40超)の共有枠組みとなっている。この研究は、UIMA Innovation AwardをIBM Watson研究所より受賞(2009年)。
5. 計算環境:並列処理の記述を殆どしなくてよい汎用的ワークフロー処理系、任意の計算資源の上に分散ファイルシステムを構築するシステムという、汎用性の高いデータ処理の枠組みを確立した。

  • Research Products

    (40 results)

All 2009 2008 Other

All Journal Article (24 results) (of which Peer Reviewed: 24 results) Presentation (15 results) Remarks (1 results)

  • [Journal Article] Evaluating Contributions of Natural Language Parsers to Protein-Protein Interaction Extraction.2009

    • Author(s)
      Miyao, Y., K.Sagae, R.Saetre, T.Matsuzaki, J.Tsujii
    • Journal Title

      Bioinformatics 25(3)

      Pages: 394-400

    • Peer Reviewed
  • [Journal Article] Fast Full Parsing by Linear-Chain Conditional Random Fields.2009

    • Author(s)
      Tsuruoka, Y., J.Tsujii, S.Ananiadou
    • Journal Title

      the Proceedings of EACL

      Pages: 790-798

    • Peer Reviewed
  • [Journal Article] Text Categorization with All Substring Features.2009

    • Author(s)
      Okanohara, D., J.Tsujii
    • Journal Title

      the Proceedings of the SIAM International Conference on Data Mining (SDM)

      Pages: 838-846

    • Peer Reviewed
  • [Journal Article] A Chinese-Japanese Lexical Machine Translation through a Pivot Language.2009

    • Author(s)
      Tsunakawa, T., N.Okazaki, X.Liu, J.Tsujii
    • Journal Title

      the Proceedings of the ACM Transactions on Asian Language Information 8(2)

      Pages: 9:1-9:21

    • Peer Reviewed
  • [Journal Article] U-Compare : share and compare text mining tools with UIMA.2009

    • Author(s)
      Kano, Y., W.A.Baumgartner Jr, L.McCrohon, S.Ananiadou, K.B.Cohen, L.Hunter, J.Tsujii
    • Journal Title

      Bioinformatics 25(15)

      Pages: 1997-1998

    • Peer Reviewed
  • [Journal Article] トポロジ情報を用いた効率的かつ漸近安定な大容量ブロードキャスト2009

    • Author(s)
      柴田剛志, 田浦健次朗
    • Journal Title

      the Proceedings of Advanced Computer Systems (ACS 2009) 2

      Pages: 47-57

    • Peer Reviewed
  • [Journal Article] Extracting Bilingual Dictionary from Comparable Corpora with Dependency Heterogeneity.2009

    • Author(s)
      Yu, K., J.Tsujii
    • Journal Title

      the Proceedings of Human Language Technologies : The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL HLT 2009)

      Pages: 121-124

    • Peer Reviewed
  • [Journal Article] Learning Combination Features with L1 Regularization.2009

    • Author(s)
      Okanohara, D., J.Tsujii
    • Journal Title

      the Proceedings of Human Language Technologies : The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL HLT 2009)

      Pages: 97-100

    • Peer Reviewed
  • [Journal Article] A Discriminative Latent Variable Chinese Segmenter with Hybrid Word/Character Information.2009

    • Author(s)
      Sun, X., Y.Zhang, T.Matsuzaki, Y.Tsuruoka, J.Tsujii
    • Journal Title

      the Proceedings of Human Language Technologies : The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL HLT 2009)

      Pages: 56-64

    • Peer Reviewed
  • [Journal Article] Semi Supervised Lexicon Mining from Parenthetical Expressions in Monolingual Web Pages.2009

    • Author(s)
      Wu, X., N.Okazaki, J.Tsujii
    • Journal Title

      the Proceedings of Human Language Technologies : The 2009 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL HLT 2009)

      Pages: 424-432

    • Peer Reviewed
  • [Journal Article] Static Relations : a Piece in the Biomedical Information Extraction Puzzle.2009

    • Author(s)
      Pyysalo, S., T.Ohta, J.-D.Kim, J.Tsujii
    • Journal Title

      the Proceedings of Natural Language Processing in Biomedicine (BioNLP) NAACL 2009 Workshop

      Pages: 1-9

    • Peer Reviewed
  • [Journal Article] From Protein-Protein Interaction to Molecular Event Extraction.2009

    • Author(s)
      Saetre, R., M.Miwa, K.Yoshida, J.Tsujii
    • Journal Title

      the Proceedings of Natural Language Processing in Biomedicine (BioNLP) NAACL 2009 Workshop

      Pages: 103-106

    • Peer Reviewed
  • [Journal Article] Incorporating GENETAG-style annotation to GENIA corpus.2009

    • Author(s)
      Ohta, T., J.-D.Kim, S.Pyysalo, Y.Wang, J.Tsujii
    • Journal Title

      the Proceedings of Natural Language Processing in Biomedicine (BioNLP) NAACL 2009 Workshop

      Pages: 106-107

    • Peer Reviewed
  • [Journal Article] Bridging the Gap between Domain-Oriented and Linguistically-Oriented Semantics.2009

    • Author(s)
      Uematsu, S., J.-D.Kim, J.Tsujii
    • Journal Title

      the Proceedings of Natural Language Processing in Biomedicine (BioNLP) NAACL 2009 Workshop

      Pages: 162-170

    • Peer Reviewed
  • [Journal Article] Overview of BioNLP'09 Shared Task on Event Extraction.2009

    • Author(s)
      Kim, J.-D., T.Ohta, S.Pyysalo, Y.Kano, J.Tsujii
    • Journal Title

      the Proceedings of the BioNLP 2009 Workshop Companion Volume for Shared Task

      Pages: 1-9

    • Peer Reviewed
  • [Journal Article] Integrated NLP Evaluation System for Pluggable Evaluation Metrics with Extensive Interoperable Toolkit.2009

    • Author(s)
      Kano, Y., L.McCrohon, S.Ananiadou, J.Tsujii
    • Journal Title

      the Proceedings of the Software engineering, testing, and quality assurance for natural language processing workshop (SETQA-NLP), NAACL-HLT

      Pages: 22-30

    • Peer Reviewed
  • [Journal Article] Sequential Labeling with Latent Variables : An Exact Inference Algorithm and An Efficient Approximation.2009

    • Author(s)
      Sun, X., J.Tsujii
    • Journal Title

      the Proceedings of the 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2009)

      Pages: 772-780

    • Peer Reviewed
  • [Journal Article] Combining Multiple Layers of Syntactic Information for Protein-Protein Interaction Extraction.2008

    • Author(s)
      Miwa, M., R.Saetre, Y.Miyao, T.Ohta, J.Tsujii
    • Journal Title

      The Proceedings of the Third International Symposium on Semantic Mining in Biomedicine (SMBM 2008)

      Pages: 101-108

    • Peer Reviewed
  • [Journal Article] Exploring the Compatibility of Heterogeneous Protein Annotations Toward Corpus Integration.2008

    • Author(s)
      Wang, Y., J.-D.Kim, R.Sartre, J.Tsujii
    • Journal Title

      The Proceedings of the Third International Symposium on Semantic Mining in Biomedicine (SMBM 2008)

      Pages: 117-124

    • Peer Reviewed
  • [Journal Article] Why Biomedical Relation Extraction Results are Incomparable and What to do about it.2008

    • Author(s)
      Pyysalo, S., R.Saetre, J.Tsujii, T.Salakoski
    • Journal Title

      The Proceedings of the Third International Symposium on Semantic Mining in Biomedicine (SMBM 2008)

      Pages: 149-152

    • Peer Reviewed
  • [Journal Article] A Discriminative Candidate Generator for String Transformations.2008

    • Author(s)
      Okazaki, N., Y.Tsuruoka, S.Ananiadou, J.Tsujii
    • Journal Title

      The Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing (EMNLP 2008)

      Pages: 447-456

    • Peer Reviewed
  • [Journal Article] Improving English-to-Chinese Translation for Technical Terms Using Morphological Information.2008

    • Author(s)
      Wu, X., N.Okazaki, T.Tsunakawa, J.Tsujii
    • Journal Title

      The Proceedings of the 8th Conference of the Association for Machine Translation in the Americas (AMTA 2008)

      Pages: 202-211

    • Peer Reviewed
  • [Journal Article] Nested Region Algebra Extended with Variables for Tag-Annotated Text Search.2008

    • Author(s)
      Masuda, K., J.Tsujii
    • Journal Title

      the Proceedings of ACM 17th Conference on Information and Knowledge Management (CIKM 2008)

      Pages: 1349-1350

    • Peer Reviewed
  • [Journal Article] FACTA : a text search engine for finding associated biomedical concepts.2008

    • Author(s)
      Tsuruoka, Y., J.Tsujii, S.Ananiadou
    • Journal Title

      Bioinformatics 24(21)

      Pages: 2259-2260

    • Peer Reviewed
  • [Presentation] High Performance Wide-area Overlay using Deadlock-free Routing.2009

    • Author(s)
      Hironaka, K., H.Saito, K.Taura
    • Organizer
      2009 International ACM Symposium on High Performance Distributed Computing (HPDC2009)
    • Place of Presentation
      Garching, Germany
    • Year and Date
      20090611-20090613
  • [Presentation] トポロジ情報を用いた効率的かつ漸近安定な大容量ブロードキャスト2009

    • Author(s)
      柴田剛志, 田浦健次郎
    • Organizer
      第7回先進的計算基盤システムシンポジウム7th Symposium on Advanced Computing Systems and infrastructures (SACSIS 2009)
    • Place of Presentation
      広島県広島市
    • Year and Date
      20090528-20090529
  • [Presentation] メッセージ衝突を防止する適応的な集合通信アルゴリズム2009

    • Author(s)
      吉富翔太, 弘中健, 田浦健次朗
    • Organizer
      先進的計算基盤システムシンポジウム(SACSIS2009)
    • Place of Presentation
      広島県広島市
    • Year and Date
      20090528-20090529
  • [Presentation] Gmount : An Ad Hoc and Locality-Aware Distributed File System by Using SSH and FUSE. Proceedings of the 2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid table of contents.2009

    • Author(s)
      Dun N., K.Taura, A.Yonezawa
    • Organizer
      2009 9th IEEE/ACM International Symposium on Cluster Computing and the Grid
    • Place of Presentation
      Shanghai, China
    • Year and Date
      20090518-20090521
  • [Presentation] 階層木言語モデルの音声認識への適用2009

    • Author(s)
      岡野原大輔, 松原勇介, 辻井潤一
    • Organizer
      日本音響学会2009年春季研究発表会
    • Place of Presentation
      東京都目黒区
    • Year and Date
      20090317-20090319
  • [Presentation] Self-Training for Mining Parenthetical Translations in Monolingual Web Pages.2009

    • Author(s)
      Wu, X., N.Okazaki, J.Tsujii
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] The Design of Chinese HPSG for Data-Oriented Parsing.2009

    • Author(s)
      Wang, X., S.Iwasawa, Y.Miyao, T.Matsuzaki, J.Tsujii
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] 自動意味役割付与のための役割集合の設計2009

    • Author(s)
      松林優一郎, 辻井潤一
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] 日中漢字の対応関係の自動獲得と中日語彙翻訳2009

    • Author(s)
      綱川隆司, 劉瀟, 岡崎直観, 辻井潤一
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] 語義曖昧性解消における統語的依存関係の寄与について2009

    • Author(s)
      羽鳥潤, 宮尾祐介, 辻井潤一
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] 蛋白質相互作用抽出への転移学習の応用2009

    • Author(s)
      三輪誠, 辻井潤一
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] GuideLink:ガイドラインの管理を同時に行うアノテーションツール2009

    • Author(s)
      大内田賢太, 金進東, 辻井潤一
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] ロジスティク回帰モデルを用いたラベル付文書クラスタリング2009

    • Author(s)
      岡野原大輔, 辻井潤一
    • Organizer
      言語処理学会第15回年次大会
    • Place of Presentation
      鳥取県鳥取市
    • Year and Date
      20090303-20090305
  • [Presentation] 大規模コーパスを扱うためのツール群2008

    • Author(s)
      岡野原大輔, 辻井潤一
    • Organizer
      言語処理学会若手の会 第3回シンポジウム
    • Place of Presentation
      静岡県熱海市
    • Year and Date
      20080922-20080923
  • [Presentation] 全ての部分文字列を考慮した文書分類2008

    • Author(s)
      岡野原大輔, 辻井潤一
    • Organizer
      情報処理学会 第187回自然言語処理研究会
    • Place of Presentation
      静岡県熱海市
    • Year and Date
      2008-09-25
  • [Remarks]

    • URL

      http://www-tsujii.is.s.u-tokyo.ac.jp/index-j.html

URL: 

Published: 2011-06-16   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi