• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2010 年度 研究成果報告書

高度言語理解のための意味・知識処理の基盤技術に関する研究

研究課題

  • PDF
研究課題/領域番号 18002007
研究種目

特別推進研究

配分区分補助金
審査区分 理工系
工学
研究機関東京大学

研究代表者

辻井 潤一  東京大学, 大学院・情報理工学系研究科, 教授 (20026313)

研究分担者 米澤 明憲  東京大学, 大学院・情報理工学研究科, 教授 (00133116)
田浦 健次朗  東京大学, 大学院・情報理工学研究科, 准教授 (90282714)
宮尾 祐介  東京大学, 大学院・情報理工学研究科, 助教 (00343096)
松崎 拓也  東京大学, 大学院・情報理工学研究科, 助教 (40463872)
研究協力者 狩野 芳伸  東京大学, 大学院・情報学環, 特任研究員
大田 朋子  東京大学, 大学院・情報学環, 特任研究員
SAETRE Rune  東京大学, 大学院・情報学環, 特任研究員
柴田 剛志  東京大学, 大学院・情報学環, 特任研究員
三輪 誠  東京大学, 大学院・情報学環, 特任研究員
PYYSALO SAMPO Mikael  東京大学, 大学院・情報学環, 特任研究員
金 進東  東京大学, 大学院・情報学環, 特任講師
SAGAE Kenji  東京大学, 大学院・情報理工学系研究科, 特任研究員
SAGAE T. Alicia  東京大学, 大学院・情報理工学系研究科, リサーチアシスタント
王 向莉  東京大学, 大学院・情報理工学系研究科, 特任研究員
綱川 隆司  東京大学, 大学院・情報理工学系研究科, 特任研究員
原 忠義  東京大学, 大学院・情報学環, 特任研究員
研究期間 (年度) 2006 – 2010
キーワード言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
研究概要

本研究は、文解析研究で成功してきた手法、すなわち、巨大な文書集合を使った機械学習技術と記号処理アルゴリズムとを融合する手法を、意味・文脈・知識処理に適用することで、言語処理技術にブレークスルーをもたらすことを目標として研究を遂行した。この結果、(1)言語理論に基づく深い文解析の高速で高耐性なシステムの開発、(2)意味・知識処理のための大規模付記コーパス(GENIAコーパス)の構築と公開、(3)深い文解析の結果を用いた固有名、事象認識などの意味・知識処理手法の開発、(4)大規模なテキスト集合の意味・知識処理を行うためのクラウド処理用ソフトウェアシステムの開発、において世界水準の成果を上げた。
(2)で構築されたGENIAコーパスは、生命科学分野でのテキストマイニング研究のための標準データ(Gold Standard)として、国際コンペティション(BioNLP09、BioNLP11)の訓練・テスト用のデータとして、採用された。また、(1)の研究成果と機械学習とを組み合わせた(3)の成果は、これらのコンペティションで高い成績を収めている。また、(1)と(4)の成果により、Medlineの論文抄録データベース(2千万件、2億超の文)からの事象認識と固有名認識を数日で完了できることを実証した。その成果は、意味処理に基づく知的な文献検索システム(MEDIE)として公開されている。

  • 研究成果

    (42件)

すべて 2010 2009 2008 2006 その他

すべて 雑誌論文 (13件) 学会発表 (24件) 図書 (3件) 備考 (2件)

  • [雑誌論文] Building a High Quality Sense Inventory for Improved Abbreviation Disambiguation. Bioinformatics.2010

    • 著者名/発表者名
      Okazaki, Naoaki, Sophia Ananiadou, Jun'ichi Tsujii.
    • 雑誌名

      Oxford University Press

  • [雑誌論文] Bio-Molecular Event Extraction with Markov Logic.2010

    • 著者名/発表者名
      Riedel, Sebastian, Rune Saetre, Hong-Woo Chun, Toshihisa Takagi, Jun'ichi Tsujii.
    • 雑誌名

      Computational Intelligence. Special Issue. Edmonton, Alberta, Canada T6G 2E8(Jin-Dong Kim (Eds.))

  • [雑誌論文] Event Extraction with Complex Event Classification Using Rich Features.2010

    • 著者名/発表者名
      Miwa, Makoto, Rune Satre, Jin-Dong Kim, Jun'ichi Tsujii.
    • 雑誌名

      Journal of Bioinformatics and Computational Biology (JBCB). 8(1)

      ページ: 131-146

  • [雑誌論文] Comparison of Chinese Treebanks for Corpus-oriented HPSG Grammar Development.2010

    • 著者名/発表者名
      Yu, Kun, Yusuke Miyao, Takuya Matsuzaki, Xiangli Wang, Yaozhong Zhang, Kiyotaka Uchimoto, Junichi Tsujii.
    • 雑誌名

      Journal of Natural Language Processing (Special Issue on Empirical Methods for Asian Language Processing). April

  • [雑誌論文] Improve Syntax-based Translation Using Deep Syntactic Structures.2010

    • 著者名/発表者名
      Wu, Xianchao, Takuya Matsuzaki, Jun'ichi Tsujii.
    • 雑誌名

      Journal of Machine Translation (Special Issue : Pushing the frontiers of SMT). 24(2)Springer

      ページ: 141-157

  • [雑誌論文] Extracting Protein-Interactions from Text with the Unified AkaneRE Event Extraction System.2010

    • 著者名/発表者名
      Saetre, Rune, Kazuhiro Yoshida, Makoto Miwa, Takuya Matsuzaki, Yoshinobu Kano, Junichi Tsujii.
    • 雑誌名

      Transactions on Computational Biology and Bioinformatics (TCBB), BioCreative II.5 Special Issue. 7 IEEE/ACM

      ページ: 46

  • [雑誌論文] A Chinese-Japanese Lexical Machine Translation through a Pivot Language.2009

    • 著者名/発表者名
      Tsunakawa, Takashi, Naoaki Okazaki, Xiao Liu, Jun'ichi Tsujii.
    • 雑誌名

      ACM Transactions on Asian Language Information Processing. 8(2)

      ページ: 9:1-9:21(ISSN: 1530-0226)

  • [雑誌論文] Evaluating Contributions of Natural Language Parsers to Protein-Protein Interaction Extraction.2009

    • 著者名/発表者名
      Miyao, Yusuke, Kenji Sagae, Rune Saetre, Takuya Matsuzaki, Jun'ichi Tsujii.
    • 雑誌名

      Bioinformatics.(Oxford University Press) 25(3)

      ページ: 394-400

  • [雑誌論文] Protein-Protein Interaction Extraction by Leveraging Multiple Kernels and Parsers.2009

    • 著者名/発表者名
      Miwa, Makoto, Rune Saetre, Yusuke Miyao, Jun'ichi Tsujii.
    • 雑誌名

      International Journal of Medical Informatics.(Mining of Clinical and Biomedical Text and Data Special Issue.) 78(12)

      ページ: e39-e46

  • [雑誌論文] Corpus annotation for mining biomedical events from lterature.2008

    • 著者名/発表者名
      Kim, Jin-Dong, Tomoko Ohta, Jun'ichi Tsujii.
    • 雑誌名

      BMC Bioinformatics.(BioMed Central) 9(1)

      ページ: 10(ISSN 1471-2105)

  • [雑誌論文] New challenges for text mining : Mapping between text and manually curated pathways.2008

    • 著者名/発表者名
      Oda, Kanae, Jin-Dong Kim, Tomoko Ohta, Daisuke Okanohara, Takuya Matsuzaki, Yuka Tateisi, Jun'ichi Tsujii.
    • 雑誌名

      BMC Bioinformatics.(BioMed Central) 9(Suppl 3)

      ページ: S5(ISSN 1471-2105)

  • [雑誌論文] Sophia Ananiadou. FACTA : a text search engine for finding associated biomedical concepts.2008

    • 著者名/発表者名
      Tsuruoka, Yoshimasa, Jun'ichi Tsujii.
    • 雑誌名

      Bioinformatics. 24(21)

      ページ: 2259-2260

  • [雑誌論文] Feature Forest Models for Probabilistic HPSG Parsing2008

    • 著者名/発表者名
      Miyao, Yusuke, Jun'ichi Tsujii.
    • 雑誌名

      Computational Linguistics. 34(1) MIT Press

      ページ: 35-80

  • [学会発表] Evaluating Dependency Representation for Event Extraction.2010

    • 著者名/発表者名
      Miwa, Makoto, Sampo Pyysalo, Tadayoshi Hara, Jun'ichi Tsujii.
    • 学会等名
      23rd COLING. pp.779-787
    • 年月日
      20100800
  • [学会発表] Entity-Focused Sentence Simplification for Relation Extraction.2010

    • 著者名/発表者名
      Miwa, Makoto, Yusuke Miyao, Rune Satre, Jun'ichi Tsujii.
    • 学会等名
      23rd COLING. pp.788-796
    • 年月日
      20100800
  • [学会発表] Fine-Grained Tree-to-String Translation Rule Extraction.2010

    • 著者名/発表者名
      Wu, Xianchao, Takuya Matsuzaki, Jun'ichi Tsujii.
    • 学会等名
      48th ACL. pp.325-334
    • 年月日
      20100700
  • [学会発表] A Simple Approach for HPSG Supertagging Using Dependency Information.2010

    • 著者名/発表者名
      Yao-zhong Zhang, Takuya Matsuzaki, Jun'ichi Tsujii.
    • 学会等名
      11th NAACL-HLT'10. pp.645-648
    • 年月日
      20100600
  • [学会発表] ParaTrac : A Fine-Grained Profiler for Data-Intensive Workflows.2010

    • 著者名/発表者名
      Dun, Nan, Kenjiro Taura, Akinori Yonezawa.
    • 学会等名
      19th ACM HPDC 2010, pp.37-48
    • 年月日
      20100600
  • [学会発表] File-Access Patterns of Data-Intensive Workflow Applications and their Implications to Distributed Filesystems.2010

    • 著者名/発表者名
      Shibata, Takeshi, SungJun Choi, Kenjiro Taura.
    • 学会等名
      3rd DIDC 2010, pp.746-755
    • 年月日
      20100600
  • [学会発表] A Japanese Particle Corpus Built by Example-Based Annotation.2010

    • 著者名/発表者名
      Hanaoka, Hiroki, Hideki Mima, Jun'ichi Tsujii.
    • 学会等名
      LREC2010. pp.1876-1880
    • 年月日
      20100500
  • [学会発表] Design and Implementation of GXP make-a Workflow System Based on Make.2010

    • 著者名/発表者名
      Taura, Kenjiro, Takuya Matsuzaki, Makoto Miwa, Yoshikazu Kamoshida, Daisaku Yokoyama, Nan Dun, Takeshi Shibata, Choi Sung Jun, Jun'ichi Tsujii.
    • 学会等名
      2010 IEEE 6th International Conference on e-Science 214-221
    • 年月日
      20100000
  • [学会発表] Forest-guided Supertagger Training.2010

    • 著者名/発表者名
      Yao-zhong Zhang, Takuya Matsuzaki, Jun'ichi Tsujii.
    • 学会等名
      23rd COLING. pp.1281-1289
    • 年月日
      20100000
  • [学会発表] The UOT System : Improve String-to-Tree Translation Using Head-Driven Phrase Structure Grammar and Predicate-Argument Structures.2009

    • 著者名/発表者名
      Wu, Xianchao, Takuya Matsuzaki, Naoaki Okazaki, Yusuke Miyao, Jun'ichi Tsujii.
    • 学会等名
      IWSLT 2009. pp.99-106
    • 年月日
      20091200
  • [学会発表] Event Extraction with Complex Event Classification using Rich Features.2009

    • 著者名/発表者名
      Miwa, Makoto, Rune Saetre, Jin-Dong Kim, Jun'ichi Tsujii.
    • 学会等名
      In the 3rd International Symposium on Languages in Biology and Medicine (LBM 2009). pp.11-19
    • 発表場所
      Honorable Mention Award
    • 年月日
      20091100
  • [学会発表] Effective Analysis of Causes and Inter-dependencies of Parsing Errors.2009

    • 著者名/発表者名
      Hara, Tadayoshi, Yusuke Miyao, Jun'ichi Tsujii.
    • 学会等名
      IWPT-09 Paris, France, pp.180-191
    • 年月日
      20091000
  • [学会発表] A Comparative Study on Generalization of Semantic Roles in FrameNet.2009

    • 著者名/発表者名
      Matsubayashi, Yuichiroh, Naoaki Okazaki, Jun'ichi Tsujii.
    • 学会等名
      ACL-IJCNLP2009. pp.19-27
    • 年月日
      20090800
  • [学会発表] Supervised Learning of a Probabilistic Lexicon of Verb Semantic Classes.2009

    • 著者名/発表者名
      Miyao, Yusuke, Jun'ichi Tsujii.
    • 学会等名
      EMNLP 2009. Singapore, pp.1328-1337
    • 年月日
      20090800
  • [学会発表] Fast Full Parsing by Linear-Chain Conditional Random2009

    • 著者名/発表者名
      Tsuruoka, Yoshimasa, Jun'ichi Tsujii, Sophia Ananiadou.
    • 学会等名
      EACL. pp.790-798
    • 年月日
      20090400
  • [学会発表] Bilingual Dictionary Extraction from Wikipedia.2009

    • 著者名/発表者名
      Yu, Kun, Junichi Tsujii.
    • 学会等名
      Proceedings of Machine Translation Summit XII.
    • 年月日
      20090000
  • [学会発表] Extracting Bilingual Dictionary from Comparable Corpora with Dependency Heterogeneity.2009

    • 著者名/発表者名
      Yu, Kun, Junichi Tsujii.
    • 学会等名
      NAACL HLT 2009. pp.121-124
    • 年月日
      20090000
  • [学会発表] A Discriminative Latent Variable Chinese Segmenter with Hybrid Word/Character Information.2009

    • 著者名/発表者名
      Sun, Xu, Yaozhong Zhang, Takuya Matsuzaki, Yoshimasa Tsuruoka, Jun'ichi Tsujii.
    • 学会等名
      NAACL-HLT'09. Boulder, Colorado, pp.56-64
    • 年月日
      20090000
  • [学会発表] HPSG Supertagging : A Sequence Labeling View.2009

    • 著者名/発表者名
      Yao-zhong Zhang, Takuya Matsuzaki, Jun'ichi Tsujii.
    • 学会等名
      11th IWPT'09. pp.210-213
    • 年月日
      20090000
  • [学会発表] Robust Approach to Abbreviating Terms : A Discriminative Latent Variable Model with Global Information.2009

    • 著者名/発表者名
      Sun, Xu, Naoaki Okazaki, Jun'ichi Tsujii.
    • 学会等名
      ACL. Singapore, pp.905-913
    • 年月日
      20090000
  • [学会発表] Semi-Supervised Lexicon Mining from Parenthetical Expressions in Monolingual Web Pages.2009

    • 著者名/発表者名
      Wu, Xianchao, Okazaki, Naoaki, Tsujii, Jun'ichi.
    • 学会等名
      Human Language Technologies : NAACL. Boulder, Colorado, pp.424-432
    • 年月日
      20090000
  • [学会発表] Latent Variable Perceptron Algorithm for Structured Classification.2009

    • 著者名/発表者名
      Sun, Xu, Takuya Matsuzaki, Daisuke Okanohara, Jun'ichi Tsujii.
    • 学会等名
      IJCAI. Los Angeles, pp.1236-1242
    • 年月日
      20090000
  • [学会発表] Evaluating Contribution of Deep Syntactic Information to Shallow Semantic Analysis.2009

    • 著者名/発表者名
      Uematsu, Sumire, Jun'ichi Tsujii.
    • 学会等名
      IWPT'09. pp.85-88
    • 年月日
      20090000
  • [学会発表] Sequential Labeling with Latent Variables : An Exact Inference Algorithm and An Efficient Approximation.2009

    • 著者名/発表者名
      Sun, Xu, Jun'ichi Tsujii.
    • 学会等名
      12th EACL 2009. Athens, Greece, pp.772-780
    • 年月日
      20090000
  • [図書] Evaluating the Impact of Re-training a Lexical Disambiguation Model on Domain Adaptation of an HPSG Parser.(Trends in Parsing Technology : Dependency Parsing, Domain Adaptation, and Deep Parsing. Text, Speech and Language Technologypp.)(Harry Bunt, Paola Merlo, Joakim Nivre (Eds.))2010

    • 著者名/発表者名
      Hara, Tadayoshi, Yusuke Miyao, Jun'ichi Tsujii.
    • 総ページ数
      253-272
    • 出版者
      Springer
  • [図書] Probabilistic Context-Free Grammars with Latent Annotations.(Supertagging-Using Complex Lexical Descriptions in Natural Language Processing.)(Srinivas Bangalore, Aravind K.Joshi (Eds.))2010

    • 著者名/発表者名
      Matsuzaki, Takuya, Yusuke Miyao, Jun'ichi Tsujii.
    • 総ページ数
      337-354
    • 出版者
      MIT Press
  • [図書] London SW1V 1AH UK(Corpora and their Annotation.)(Text Mining for Biology and Biomedicine. 46 Gillingham Street)(Sophia Ananiadou, John McNaught, (Eds.))2006

    • 著者名/発表者名
      Kim, Jin-Dong, Jun'ichi Tsujii.
    • 総ページ数
      ISBN 1-58053-984-X
    • 出版者
      Artech House
  • [備考] プロジェクト

    • URL

      http://www-tsujii.is.s.u-tokyo.ac.jp/aNT/

  • [備考] 研究成果を反映したサービスを行う英国マンチェスター大学、国立テキストマイニングセンター

    • URL

      http://www.nactem.ac.uk/pathtext/

URL: 

公開日: 2012-02-13   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi