• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2009 年度 実績報告書

自然言語処理特化型の視覚的・対話的な半自動エラー解析のできる統合機械学習システム

研究課題

研究課題/領域番号 21500130
研究機関東京大学

研究代表者

狩野 芳伸  東京大学, 大学院・情報学環, 特任研究員 (20506729)

研究分担者 三輪 誠  東京大学, 大学院・情報学環, 特任研究員 (00529646)
キーワード自然言語処理 / 機械学習 / エラー解析 / 視覚化 / 相互運用性
研究概要

本研究の目的は、機械学習を用いた自然言語処理タスクの実行をサポートする、統合自然言語処理環境の構築である。そのために、大きく分けて1.対応互換コンポーネント(コーパスリーダー・ツール)の追加とtype systemの拡張2.基盤システムの拡張と改良3.ユーザ・開発者のからのフィードバックとドキュメント等整備が必要である。
まず、基盤システムであるU-Compareに対応したコンポーネントを充実させるため、各国の研究機関と協力し作業を行うと同時に、type systemを拡張し新たなデータタイプをカバーした。
基盤システムの拡張については、機械学習との接続関係、特に視覚化部分の改良と発展の実装作業を行った。また、並列化によりワークフロー実行時のパフォーマンスを向上させるため、任意のUIMAコンポーネントをクラスタシステムに自動分散展開してサービス化し、外部からは単一サービスとして実行できる機構を実装した。
同時に、ドキュメントの増強やビデオチュートリアルの作成を行い、開発者・ユーザのための環境を整えた。関連学会への出席や講演等を積極的に行い、ユーザ数の増加を目指すとともにフィードバックを受けシステムの改良を行った。
BioNLP 2009 Shared Task on Event Extractionにorganizerとして参加し、基盤システムを公式サポートシステムとして提供した。さらに、基盤システムの機能を用いて、参加者の結果の混合を行い、どの参加者の結果よりもよりよい結果を得ることに成功した。発展として、参加者から数グループと共同作業を行い、参加者のツールを基盤システムに対応した互換コンポーネントとして一般提供する準備を進めている。
また、Bio Creative II.5に参加し、基盤システムを用いてワークフローの生成とサービス化を行った。CoNLL 2010 Shared Taskでも公式ツールとして対応互換コンポーネントが提供されるなど、ユーザ層を確実に広げることができた。

  • 研究成果

    (4件)

すべて 2009

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件)

  • [雑誌論文] U-Compare : share and compare text mining tools with UIMA2009

    • 著者名/発表者名
      Kano, Yoshinobu, William A.Baumgartner Jr, Luke McCrohon, Sophia Ananiadou, K.Bretonnel Cohen, Lawrence Hunter, Jun'ichi Tsujii
    • 雑誌名

      Bioinformatics 25(15)

      ページ: 1997-1998

    • 査読あり
  • [学会発表] AkaneRE Relation Extraction : Protein Interaction and Normalization in the BioCreAtIvE II.5 Challenge2009

    • 著者名/発表者名
      Saetre, Rune, Kazuhiro Yoshida, Makoto Miwa, Takuya Matsuzaki, Yoshinobu Kano, Jun'ichi Tsujii
    • 学会等名
      In the BioCreative II.5 Workshop 2009 special session | Digital Annotations
    • 発表場所
      Madrid, Spain
    • 年月日
      20091000
  • [学会発表] Integrated NLP Evaluation System for Pluggable Evaluation Metrics with Extensive Interoperable Toolkit (査読有)2009

    • 著者名/発表者名
      Kano, Yoshinobu, Luke McCrohon, Sophia Ananiadou, Jun'ichi Tsujii
    • 学会等名
      In the Software engineering, testing, and quality assurance for natural language processing workshop (SETQA-NLP), NAACL-HLT
    • 発表場所
      Boulder, Colorado, USA
    • 年月日
      20090600
  • [学会発表] Overview of BioNLP'09 Shared Task on Event Extraction2009

    • 著者名/発表者名
      Kim, Jin-Dong, Tomoko Ohta, Sampo Pyysalo, Yoshinobu Kano, Jun'ichi Tsujii
    • 学会等名
      n the Proceedings of the BioNLP 2009 Workshop Companion Volume for Shared Task
    • 発表場所
      Boulder, Colorado, USA
    • 年月日
      20090600

URL: 

公開日: 2011-06-16   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi