2006 Fiscal Year Annual Research Report

高度言語理解のための意味・知識処理の基盤技術に関する研究

Research Project

Project/Area Number	18002007
Research Institution	The University of Tokyo
Principal Investigator	辻井潤一東京大学, 大学院情報理工学系研究科, 教授 (20026313)
Co-Investigator(Kenkyū-buntansha)	米澤明憲東京大学, 大学院情報理工学系研究科, 教授 (00133116) 田浦健次朗東京大学, 大学院情報理工学系研究科, 助教授 (90282714) 宮尾祐介東京大学, 大学院情報理工学系研究科, 助手 (00343096)
Keywords	言語理解 / 意味処理 / テキストマイニング / 文脈処理 / 知的検索
Research Abstract	本研究は、過去10年間、文解析研究で成功してきた手法、すなわち、巨大な文書集合からの機械学習技術と記号処理アルゴリズムを融合する手法を、意味・文脈・知識処理に適用することで、言語処理技術にブレークスルーをもたらすことを目標とする。このため、テキストへの意味アノテーション付与、分野オントロジーの自動構築、意味・知識に基づく文解析手法、資源共有型の分散計算機環境の構築、の研究を行う。平成18年度は、プロジェクトの初年度として、分散計算機環境の基盤となるクラスターの構築を行うとともに、以下の研究成果を上げた。 1.事象アノテーション:生命科学での標準オントロジーであるGO(Geneontology)に基づき37の事象カテゴリを設定し、これを使ってMEDLINE論文抄録(1,000)に事象アノテーションを行った。9,000文に対して、34,000の事象をアノテートしたものであり、質・量の両面で同種の試みをリードする成果になっている。 2. GENIAコーパスと分野オントロジーのリンク: GO、UMLS、Mesh、BioPAXなど、標準となるオントロジーと文書アノテーションのために我々が開発したGENIAオントロジーとの相互リンクを確立した。これは、次年度以降の知識処理研究の基礎となる。 3.文解析システムの高度化、高効率化:英文解析器(Enju)の高速化を行い、従来比50倍の速度向上を得た。また、意味・知識処理に不可欠な分野適応技術の枠組みを設定し、生命科学文献における解析精度を86.39%から90.15%に向上させることに成功した。この2つの技術は、次年度以降、意味・知識を導入した言語処理を行う基盤となる。 4.分野適応と文書アノテーション:能動型の機械学習(Active Learning)をPOSタガーに適用することで、10分の一のアノテーション文書でほぼ同じ性能(精度98.5% vs 98.4%)が達成できることを確認した。この成果をより複雑度の高いタスク(Shallow/Deep Parsing, NER、ERなど)に適用していくことが、来年度以降の課題となる。

Research Products
(30 results)

All 2007 2006

All Journal Article (28 results) Book (1 results) Patent(Industrial Property Rights) (1 results)

[Journal Article] 最小記述長原理に基づいた日本語話し言葉の単語分割.2007
- Author(s)
  松原勇介, 秋葉友良, 辻井潤一
- Journal Title
  
  言語処理学会第13回年次大会発表論文集.
[Journal Article] 潜在的情報を利用した文識別モテル.2007
- Author(s)
  岡野原, 大輔辻井潤一
- Journal Title
  
  言語処理学会第13回年次大会発表論文集.
[Journal Article] Efficient HPSG Parsing with Supertagging and CFG-filtering.2007
- Author(s)
  Matsuzaki Takuya, Yusuke Miyao, Jun'ichi Tsujii.
- Journal Title
  
  In the Proceedings of the Twentieth International Joint Conference on Artificial Intelligence.
[Journal Article] Locality-aware Connection Management and Rank Assignment for Wide-area MPI.2007
- Author(s)
  Hideo Saito, Kenjiro Taura.
- Journal Title
  
  The IEEE International Symposium on CCGrid 2007. Rio de Janeiro,Brazil. (To appear)
[Journal Article] A Fast T Topology Inference --- A building block for network-aware parallel processing.2007
- Author(s)
  Tatsuya Shiral, Hideo Saito, Kenjiro Taura
- Journal Title
  
  The IEEE International Symposium on HPDC 2007. Monterey,USA. (To appear)
[Journal Article] 高速なトポロジー推定-ネツトワークを考慮した並列計算のための基盤として.2007
- Author(s)
  白井逹也, 斎藤秀雄, 田浦健次朗
- Journal Title
  
  Symposium on Advanced Computing Systems and Infrastructures 2007 (採録)
[Journal Article] 広域MPI用の局所性を考慮した接続管理とランク割り当て2007
- Author(s)
  斎藤秀雄, 田浦健次朗
- Journal Title
  
  Symposium on Advanced Computing Systems and Infrastructures2007 (採録)
[Journal Article] 動的にチャネルが増減する環境下での分散スナップショットアルゴリズム.2007
- Author(s)
  澤井省吾, 田浦健次朗, 近山隆
- Journal Title
  
  第63回ブログラミング研究会
[Journal Article] 機械学習を用いた文脈自由規則の書き換えによる文圧縮.2006
- Author(s)
  海野裕也, 二宮崇, 宮尾祐介, 辻井潤一
- Journal Title
  
  言語処理学会第12回年次大会発表論文集
  
  Pages: 1091-1094
[Journal Article] 頑健なHPSGパーザの出力のTDL意味表現への変換.2006
- Author(s)
  佐藤学, 戸次大介, 宮尾祐介, 辻井潤一
- Journal Title
  
  言語処理学会第12回年次大会発表論文集.
[Journal Article] Automatic Recognition of Topic-Classified Relations between Prostate Cancer and Genes from Medline Abstracts.2006
- Author(s)
  Chun, Hong-woo, Yoshimasa Tsuruoka, Jin-Dong Kim, Rie Shiba, Naoki Nagata, Teruyoshi Hishiki, Jun'ichi Tsujii
- Journal Title
  
  In the Proceedings of the second international symposium on semantic mining in Biomedicine. Jena, Germany
  
  Pages: 5-12
[Journal Article] Subdomain adaptation of a POS tagger with a small corpus.2006
- Author(s)
  Tateisi, Yuka, Yoshimasa Tsuruoka, Jun'ichi Tsujii
- Journal Title
  
  In the Proceedings of the HLT-NAACL BioNLP Workshop on Linking Natural Language and Biology. New York, USA
  
  Pages: 136-137
[Journal Article] Trimming CFG Parse Trees for sentence compression Using Machine Learning Approaches.2006
- Author(s)
  Unno, Yuya, Takashi Ninomiya, Yusuke Miyao, Jun'ichi Tsujii.
- Journal Title
  
  Proceedings of the COLING/ACL 2006 Main Conference Poster Sessions. Sydney, Australia
  
  Pages: 850-857
[Journal Article] An Intelligent Search Engine and GUI-based Efficient MEDLINE Search Tool Based on Deep Syntactic Parsing.2006
- Author(s)
  Ohta, Tomoko, Yusuke Miyao, Takashi Ninomiya, Yoshimasa Tsuruoka, Akane Yakushiji, Katsuya Masuda, Jumpei Takeuchi, Kazuhiro Yoshida, Tadayoshi Hara, Jin-Dong Kim, Yuka Tateisi, Jun'ichi Tsujii
- Journal Title
  
  In the Proceedings of the COLING/ACL 2006 Interactive Presentation Sessions. Sydney, Australia
  
  Pages: 17-20
[Journal Article] Automatic Construction of Predicate-argument Structure Patterns for Biomedical Information Extraction.2006
- Author(s)
  Yakushiji Akane, Miyao Yusuke, Ohta Tomoko, Tateisi, Yuka, Tsujii, Jun'ichi.
- Journal Title
  
  In the Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing. Sydney, Australia
  
  Pages: 284-292
[Journal Article] Linguistic and Biological Annotations of Biological Interaction Events.2006
- Author(s)
  Ohta, Tomoko, Yuka Tateisi, Jin-Dong Kim, Akane Yakushiji, Jun-ichi Tsujii.
- Journal Title
  
  In the Proceedings of The Fifth International Conference on Language Resource and Evaluation (LREC 2006). Genoa, Italy
  
  Pages: 1405-1408
[Journal Article] Translating HPSG-style Outputs of a Robust Parser into Typed Dynamic Logic.2006
- Author(s)
  Sato Manabu, Daisuke Bekki, Yusuke Miyao, Jun'ichi Tsujii.
- Journal Title
  
  In the Proceedings of COLING-ACL 2006 Poster Session. Sydney, Australia
[Journal Article] Semantic Retrieval for the Accurate Identification of Relational Concepts in Massive Textbases.2006
- Author(s)
  Miyao, Yusuke, Tomoko Ohta, Katsuya Masuda, Yoshimasa Tsuruoka, Kazuhiro Yoshida, Takashi Ninomiya, Jun'ichi Tsujii
- Journal Title
  
  In the Proceedings of COLING-ACL 2006. Sydney, Australia
  
  Pages: 1017-1024
[Journal Article] Improving the Scalability of Semi-Markov Conditional Random Fields for Named Entity Recognition.2006
- Author(s)
  Daisuke Okanohara, Yusuke Miyao, Yoshimasa Tsuruoka, Jun'ichi Tsujii.
- Journal Title
  
  In the Proceedings of ACL 2006. Sydney, Australia
[Journal Article] Extremely Lexicalized Models for Accurate and Fast HPSG Parsing.2006
- Author(s)
  Ninomiya, Takashi, Takuya Matsuzaki, Yoshimasa Tsuruoka, Yusuke Miyao, Jun'ichi Tsujii
- Journal Title
  
  In the Proc. of EMNLP 2006. Sydney, Australia
  
  Pages: 155-163
[Journal Article] Extraction of Gene-Disease Relations from MedLine using Domain Dictionaries and Machine Learning.2006
- Author(s)
  Chun, Hong-woo, Yoshimasa Tsuruoka, Jin-Dong Kim, Rie Shiba, Naoki Nagata, Teruyoshi Hishiki, Jun'ichi Tsujii.
- Journal Title
  
  The Pacific Symposium on Biocomputing (PSB) Maui, Hawaii, USA
  
  Pages: 4-15
[Journal Article] 囲碁におる正確な看手予測のためのファジーパターンマツチング2006
- Author(s)
  荒木伸夫, 吉田和弘, 鶴岡慶雅, 辻井潤一
- Journal Title
  
  人工知能学会全国大会(第20回)論文集
[Journal Article] Text Mining and its potential applications in systems biology.2006
- Author(s)
  Ananiadou, Sophia, Douglous Kell, Junichi Tsujii.
- Journal Title
  
  Trends in Biotechmology.
[Journal Article] Fast and Scalable HPSG Parsing.2006
- Author(s)
  Ninomiya, Takashi, Yoshimasa Tsuruoka, Yusuke Miyao, Kenjiro Taura, Jun'ichi Tsujii
- Journal Title
  
  Traitement automatique des langues (TAL).
[Journal Article] Automatic Recognition of Topic-Classified Relations between Prostate Cancer and Genes using MEDLINE Abstracts.2006
- Author(s)
  Chun, Hong-woo, Yoshimasa Tsuruoka, Jin-Dong Kim, Rie Shiba, Naoki Nagata, Teruyoshi Hishiki, Jun'ichi Tsujii.
- Journal Title
  
  BMC-Bioinformatics. 7
[Journal Article] MPI/GXP : 広域環境用の適応的なメッセージパッシングシステム.2006
- Author(s)
  斎藤秀雄, 田浦健次朗, 近山隆
- Journal Title
  
  並列/分散/協調処理に関するサマーワークショッブ(SWoPP2006),高知
  
  Pages: 25-30
[Journal Article] 低負荷で多数の計算機をリアルタイムに監視するシステムVGXPの実装2006
- Author(s)
  鴨志田良和, 金田憲二, 遠藤敏夫, 田浦健次朗, 近山隆
- Journal Title
  
  並列/分散/協調処理に関する『高知』サマー・ワークショッブ,信学技報 Vol.106, No.199
  
  Pages: 19-24
[Journal Article] A Low-Stretch Object Migration Scheme for Wide-Area Environments.2006
- Author(s)
  Ken Hironaka, Kenjiro Taura, Takashi Chikayama.
- Journal Title
  
  第63回ブログラミング研究会
[Book] Corpora and their Annotation.2006
- Author(s)
  Kim, Jin-Dong, Jun'icni Tsujii.
- Publisher
  Text Mining for Biology and Biomedicine.
[Patent(Industrial Property Rights)] テータ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システ厶および方法2006
- Inventor(s)
  増田勝也, 辻井潤一
- Industrial Property Rights Holder
  増田勝也
- Industrial Property Number
  出願中
- Filing Date
  2006-07-14

2006 Fiscal Year Annual Research Report

高度言語理解のための意味・知識処理の基盤技術に関する研究

Principal Investigator

辻井 潤一 東京大学, 大学院情報理工学系研究科, 教授 (20026313)

Research Products

[Journal Article] 最小記述長原理に基づいた日本語話し言葉の単語分割.2007

Author(s)

Journal Title

[Journal Article] 潜在的情報を利用した文識別モテル.2007

Author(s)

Journal Title

[Journal Article] Efficient HPSG Parsing with Supertagging and CFG-filtering.2007

Author(s)

Journal Title

[Journal Article] Locality-aware Connection Management and Rank Assignment for Wide-area MPI.2007

Author(s)

Journal Title

[Journal Article] A Fast T Topology Inference --- A building block for network-aware parallel processing.2007

Author(s)

Journal Title

[Journal Article] 高速なトポロジー推定-ネツトワークを考慮した並列計算のための基盤として.2007

Author(s)

Journal Title

[Journal Article] 広域MPI用の局所性を考慮した接続管理とランク割り当て2007

Author(s)

Journal Title

[Journal Article] 動的にチャネルが増減する環境下での分散スナップショットアルゴリズム.2007

Author(s)

Journal Title

[Journal Article] 機械学習を用いた文脈自由規則の書き換えによる文圧縮.2006

Author(s)

Journal Title

[Journal Article] 頑健なHPSGパーザの出力のTDL意味表現への変換.2006

Author(s)

Journal Title

[Journal Article] Automatic Recognition of Topic-Classified Relations between Prostate Cancer and Genes from Medline Abstracts.2006

Author(s)

Journal Title

[Journal Article] Subdomain adaptation of a POS tagger with a small corpus.2006

Author(s)

Journal Title

[Journal Article] Trimming CFG Parse Trees for sentence compression Using Machine Learning Approaches.2006

Author(s)

Journal Title

[Journal Article] An Intelligent Search Engine and GUI-based Efficient MEDLINE Search Tool Based on Deep Syntactic Parsing.2006

Author(s)

Journal Title

[Journal Article] Automatic Construction of Predicate-argument Structure Patterns for Biomedical Information Extraction.2006

Author(s)

Journal Title

[Journal Article] Linguistic and Biological Annotations of Biological Interaction Events.2006

Author(s)

Journal Title

[Journal Article] Translating HPSG-style Outputs of a Robust Parser into Typed Dynamic Logic.2006

Author(s)

Journal Title

[Journal Article] Semantic Retrieval for the Accurate Identification of Relational Concepts in Massive Textbases.2006

Author(s)

Journal Title

[Journal Article] Improving the Scalability of Semi-Markov Conditional Random Fields for Named Entity Recognition.2006

Author(s)

Journal Title

[Journal Article] Extremely Lexicalized Models for Accurate and Fast HPSG Parsing.2006

Author(s)

Journal Title

[Journal Article] Extraction of Gene-Disease Relations from MedLine using Domain Dictionaries and Machine Learning.2006

Author(s)

Journal Title

[Journal Article] 囲碁におる正確な看手予測のためのファジーパターンマツチング2006

Author(s)

Journal Title

[Journal Article] Text Mining and its potential applications in systems biology.2006

Author(s)

Journal Title

[Journal Article] Fast and Scalable HPSG Parsing.2006

Author(s)

Journal Title

[Journal Article] Automatic Recognition of Topic-Classified Relations between Prostate Cancer and Genes using MEDLINE Abstracts.2006

Author(s)

Journal Title

辻井潤一東京大学, 大学院情報理工学系研究科, 教授 (20026313)