• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

高度言語理解のための意味・知識処理の基盤技術に関する研究

研究課題

研究課題/領域番号 18002007
研究機関東京大学

研究代表者

辻井 潤一  東京大学, 大学院情報理工学系研究科, 教授 (20026313)

研究分担者 米澤 明憲  東京大学, 大学院情報理工学系研究科, 教授 (00133116)
田浦 健次朗  東京大学, 大学院情報理工学系研究科, 助教授 (90282714)
宮尾 祐介  東京大学, 大学院情報理工学系研究科, 助手 (00343096)
キーワード言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
研究概要

本研究は、過去10年間、文解析研究で成功してきた手法、すなわち、巨大な文書集合からの機械学習技術と記号処理アルゴリズムを融合する手法を、意味・文脈・知識処理に適用することで、言語処理技術にブレークスルーをもたらすことを目標とする。このため、テキストへの意味アノテーション付与、分野オントロジーの自動構築、意味・知識に基づく文解析手法、資源共有型の分散計算機環境の構築、の研究を行う。
平成18年度は、プロジェクトの初年度として、分散計算機環境の基盤となるクラスターの構築を行うとともに、以下の研究成果を上げた。
1.事象アノテーション:生命科学での標準オントロジーであるGO(Geneontology)に基づき37の事象カテゴリを設定し、これを使ってMEDLINE論文抄録(1,000)に事象アノテーションを行った。9,000文に対して、34,000の事象をアノテートしたものであり、質・量の両面で同種の試みをリードする成果になっている。
2. GENIAコーパスと分野オントロジーのリンク: GO、UMLS、Mesh、BioPAXなど、標準となるオントロジーと文書アノテーションのために我々が開発したGENIAオントロジーとの相互リンクを確立した。これは、次年度以降の知識処理研究の基礎となる。
3.文解析システムの高度化、高効率化:英文解析器(Enju)の高速化を行い、従来比50倍の速度向上を得た。また、意味・知識処理に不可欠な分野適応技術の枠組みを設定し、生命科学文献における解析精度を86.39%から90.15%に向上させることに成功した。この2つの技術は、次年度以降、意味・知識を導入した言語処理を行う基盤となる。
4.分野適応と文書アノテーション:能動型の機械学習(Active Learning)をPOSタガーに適用することで、10分の一のアノテーション文書でほぼ同じ性能(精度98.5% vs 98.4%)が達成できることを確認した。この成果をより複雑度の高いタスク(Shallow/Deep Parsing, NER、ERなど)に適用していくことが、来年度以降の課題となる。

  • 研究成果

    (30件)

すべて 2007 2006

すべて 雑誌論文 (28件) 図書 (1件) 産業財産権 (1件)

  • [雑誌論文] 最小記述長原理に基づいた日本語話し言葉の単語分割.2007

    • 著者名/発表者名
      松原勇介, 秋葉友良, 辻井潤一
    • 雑誌名

      言語処理学会第13回年次大会発表論文集.

  • [雑誌論文] 潜在的情報を利用した文識別モテル.2007

    • 著者名/発表者名
      岡野原, 大輔 辻井潤一
    • 雑誌名

      言語処理学会第13回年次大会発表論文集.

  • [雑誌論文] Efficient HPSG Parsing with Supertagging and CFG-filtering.2007

    • 著者名/発表者名
      Matsuzaki Takuya, Yusuke Miyao, Jun'ichi Tsujii.
    • 雑誌名

      In the Proceedings of the Twentieth International Joint Conference on Artificial Intelligence.

  • [雑誌論文] Locality-aware Connection Management and Rank Assignment for Wide-area MPI.2007

    • 著者名/発表者名
      Hideo Saito, Kenjiro Taura.
    • 雑誌名

      The IEEE International Symposium on CCGrid 2007. Rio de Janeiro,Brazil. (To appear)

  • [雑誌論文] A Fast T Topology Inference --- A building block for network-aware parallel processing.2007

    • 著者名/発表者名
      Tatsuya Shiral, Hideo Saito, Kenjiro Taura
    • 雑誌名

      The IEEE International Symposium on HPDC 2007. Monterey,USA. (To appear)

  • [雑誌論文] 高速なトポロジー推定-ネツトワークを考慮した並列計算のための基盤として.2007

    • 著者名/発表者名
      白井逹也, 斎藤秀雄, 田浦健次朗
    • 雑誌名

      Symposium on Advanced Computing Systems and Infrastructures 2007 (採録)

  • [雑誌論文] 広域MPI用の局所性を考慮した接続管理とランク割り当て2007

    • 著者名/発表者名
      斎藤秀雄, 田浦健次朗
    • 雑誌名

      Symposium on Advanced Computing Systems and Infrastructures2007 (採録)

  • [雑誌論文] 動的にチャネルが増減する環境下での分散スナップショットアルゴリズム.2007

    • 著者名/発表者名
      澤井省吾, 田浦健次朗, 近山隆
    • 雑誌名

      第63回ブログラミング研究会

  • [雑誌論文] 機械学習を用いた文脈自由規則の書き換えによる文圧縮.2006

    • 著者名/発表者名
      海野 裕也, 二宮 崇, 宮尾 祐介, 辻井 潤一
    • 雑誌名

      言語処理学会第12回年次大会発表論文集

      ページ: 1091-1094

  • [雑誌論文] 頑健なHPSGパーザの出力のTDL意味表現への変換.2006

    • 著者名/発表者名
      佐藤学, 戸次大介, 宮尾祐介, 辻井潤一
    • 雑誌名

      言語処理学会第12回年次大会発表論文集.

  • [雑誌論文] Automatic Recognition of Topic-Classified Relations between Prostate Cancer and Genes from Medline Abstracts.2006

    • 著者名/発表者名
      Chun, Hong-woo, Yoshimasa Tsuruoka, Jin-Dong Kim, Rie Shiba, Naoki Nagata, Teruyoshi Hishiki, Jun'ichi Tsujii
    • 雑誌名

      In the Proceedings of the second international symposium on semantic mining in Biomedicine. Jena, Germany

      ページ: 5-12

  • [雑誌論文] Subdomain adaptation of a POS tagger with a small corpus.2006

    • 著者名/発表者名
      Tateisi, Yuka, Yoshimasa Tsuruoka, Jun'ichi Tsujii
    • 雑誌名

      In the Proceedings of the HLT-NAACL BioNLP Workshop on Linking Natural Language and Biology. New York, USA

      ページ: 136-137

  • [雑誌論文] Trimming CFG Parse Trees for sentence compression Using Machine Learning Approaches.2006

    • 著者名/発表者名
      Unno, Yuya, Takashi Ninomiya, Yusuke Miyao, Jun'ichi Tsujii.
    • 雑誌名

      Proceedings of the COLING/ACL 2006 Main Conference Poster Sessions. Sydney, Australia

      ページ: 850-857

  • [雑誌論文] An Intelligent Search Engine and GUI-based Efficient MEDLINE Search Tool Based on Deep Syntactic Parsing.2006

    • 著者名/発表者名
      Ohta, Tomoko, Yusuke Miyao, Takashi Ninomiya, Yoshimasa Tsuruoka, Akane Yakushiji, Katsuya Masuda, Jumpei Takeuchi, Kazuhiro Yoshida, Tadayoshi Hara, Jin-Dong Kim, Yuka Tateisi, Jun'ichi Tsujii
    • 雑誌名

      In the Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions. Sydney, Australia

      ページ: 17-20

  • [雑誌論文] Automatic Construction of Predicate-argument Structure Patterns for Biomedical Information Extraction.2006

    • 著者名/発表者名
      Yakushiji Akane, Miyao Yusuke, Ohta Tomoko, Tateisi, Yuka, Tsujii, Jun'ichi.
    • 雑誌名

      In the Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing. Sydney, Australia

      ページ: 284-292

  • [雑誌論文] Linguistic and Biological Annotations of Biological Interaction Events.2006

    • 著者名/発表者名
      Ohta, Tomoko, Yuka Tateisi, Jin-Dong Kim, Akane Yakushiji, Jun-ichi Tsujii.
    • 雑誌名

      In the Proceedings of The Fifth International Conference on Language Resource and Evaluation (LREC 2006). Genoa, Italy

      ページ: 1405-1408

  • [雑誌論文] Translating HPSG-style Outputs of a Robust Parser into Typed Dynamic Logic.2006

    • 著者名/発表者名
      Sato Manabu, Daisuke Bekki, Yusuke Miyao, Jun'ichi Tsujii.
    • 雑誌名

      In the Proceedings of COLING-ACL 2006 Poster Session. Sydney, Australia

  • [雑誌論文] Semantic Retrieval for the Accurate Identification of Relational Concepts in Massive Textbases.2006

    • 著者名/発表者名
      Miyao, Yusuke, Tomoko Ohta, Katsuya Masuda, Yoshimasa Tsuruoka, Kazuhiro Yoshida, Takashi Ninomiya, Jun'ichi Tsujii
    • 雑誌名

      In the Proceedings of COLING-ACL 2006. Sydney, Australia

      ページ: 1017-1024

  • [雑誌論文] Improving the Scalability of Semi-Markov Conditional Random Fields for Named Entity Recognition.2006

    • 著者名/発表者名
      Daisuke Okanohara, Yusuke Miyao, Yoshimasa Tsuruoka, Jun'ichi Tsujii.
    • 雑誌名

      In the Proceedings of ACL 2006. Sydney, Australia

  • [雑誌論文] Extremely Lexicalized Models for Accurate and Fast HPSG Parsing.2006

    • 著者名/発表者名
      Ninomiya, Takashi, Takuya Matsuzaki, Yoshimasa Tsuruoka, Yusuke Miyao, Jun'ichi Tsujii
    • 雑誌名

      In the Proc. of EMNLP 2006. Sydney, Australia

      ページ: 155-163

  • [雑誌論文] Extraction of Gene-Disease Relations from MedLine using Domain Dictionaries and Machine Learning.2006

    • 著者名/発表者名
      Chun, Hong-woo, Yoshimasa Tsuruoka, Jin-Dong Kim, Rie Shiba, Naoki Nagata, Teruyoshi Hishiki, Jun'ichi Tsujii.
    • 雑誌名

      The Pacific Symposium on Biocomputing (PSB) Maui, Hawaii, USA

      ページ: 4-15

  • [雑誌論文] 囲碁におる正確な看手予測のためのファジーパターンマツチング2006

    • 著者名/発表者名
      荒木伸夫, 吉田和弘, 鶴岡慶雅, 辻井潤一
    • 雑誌名

      人工知能学会全国大会(第20回)論文集

  • [雑誌論文] Text Mining and its potential applications in systems biology.2006

    • 著者名/発表者名
      Ananiadou, Sophia, Douglous Kell, Junichi Tsujii.
    • 雑誌名

      Trends in Biotechmology.

  • [雑誌論文] Fast and Scalable HPSG Parsing.2006

    • 著者名/発表者名
      Ninomiya, Takashi, Yoshimasa Tsuruoka, Yusuke Miyao, Kenjiro Taura, Jun'ichi Tsujii
    • 雑誌名

      Traitement automatique des langues (TAL).

  • [雑誌論文] Automatic Recognition of Topic-Classified Relations between Prostate Cancer and Genes using MEDLINE Abstracts.2006

    • 著者名/発表者名
      Chun, Hong-woo, Yoshimasa Tsuruoka, Jin-Dong Kim, Rie Shiba, Naoki Nagata, Teruyoshi Hishiki, Jun'ichi Tsujii.
    • 雑誌名

      BMC-Bioinformatics. 7

  • [雑誌論文] MPI/GXP : 広域環境用の適応的なメッセージパッシングシステム.2006

    • 著者名/発表者名
      斎藤秀雄, 田浦健次朗, 近山隆
    • 雑誌名

      並列/分散/協調処理に関するサマーワークショッブ(SWoPP2006),高知

      ページ: 25-30

  • [雑誌論文] 低負荷で多数の計算機をリアルタイムに監視するシステムVGXPの実装2006

    • 著者名/発表者名
      鴨志田良和, 金田憲二, 遠藤敏夫, 田浦健次朗, 近山隆
    • 雑誌名

      並列/分散/協調処理に関する『高知』サマー・ワークショッブ,信学技報 Vol.106, No.199

      ページ: 19-24

  • [雑誌論文] A Low-Stretch Object Migration Scheme for Wide-Area Environments.2006

    • 著者名/発表者名
      Ken Hironaka, Kenjiro Taura, Takashi Chikayama.
    • 雑誌名

      第63回ブログラミング研究会

  • [図書] Corpora and their Annotation.2006

    • 著者名/発表者名
      Kim, Jin-Dong, Jun'icni Tsujii.
    • 出版者
      Text Mining for Biology and Biomedicine.
  • [産業財産権] テータ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システ厶および方法2006

    • 発明者名
      増田勝也, 辻井潤一
    • 権利者名
      増田勝也
    • 産業財産権番号
      出願中
    • 出願年月日
      2006-07-14

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi