• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2007 Fiscal Year Annual Research Report

書き言葉コーパスの自動アノテーションの研究

Planned Research

Project AreaCompilation of a balanced corpus of written Japanese: Infrastructure for the coming Japanese linguistics
Project/Area Number 18061005
Research InstitutionNara Institute of Science and Technology

Principal Investigator

松本 裕治  Nara Institute of Science and Technology, 情報科学研究科, 教授 (10211575)

Co-Investigator(Kenkyū-buntansha) 徳永 健伸  東京工業大学, 大学院・情報理工学研究科, 教授 (20197875)
乾 健太郎  東京工業大学, 大学院・情報理工学研究科, 教授 (60272689)
橋田 浩一  独立行政法人産業技術研究所, 情報義と術研究部門, 副研究部門長 (00357766)
浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助教 (80379528)
Keywordsアノテーション / 形態素解析 / 統語解析 / 述語項構造解析 / コーパス / 照応解析 / 談話解析 / 言語解析
Research Abstract

コーパスに対する自動アノテーションツールの開発:係り受け解析において最適の係り先を比較によって決定する手法の提案,述語項構造解析のための手法の事態名詞への拡張を行い,システムの開発の過程で作成した共参照および項構造情報が付与されたコーパスを公開した。
コーパス管理ツールの開発:形態素・係り受け解析コーパス管理ツールに対していくつかの機能拡張を行った。特に、係り受け構造の表示機能の充実、および、高頻度の連続・非連続のパターンのマイニング機能などを開発した。汎用アノテーションツールについてデータ構造の設計の詳細化といくつかの機能拡張を行った。さらに、Webベースのコーパス検索ツールの開発を行った。
大規模な固有表現辞書の構築:Wikipediaの構造情報を利用し、自動的に固有表現を抽出する手法を提案し、実際に大規模な固有表現抽出を行った。抽出した大規模固有表現辞書とコーパスからの統計的手法を組み合わせることにより、精度向上を図った。白書コアデータ対する固有表現タグ付け作業を行った。
談話構造アノテーションツールの開発:文関数、共参照、項構造を記述するためセマンティックエディタの拡張を行った.一般化された木構造表示ユーザインタフェスの実装を行い、談話構造や述語に対する統語的構成素の記述や文章の埋め込み構造、意味構造を編集する機能をこのユーザインタフェースにプラグインする形で実装した。

  • Research Products

    (5 results)

All 2008 2007 Other

All Journal Article (3 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Remarks (1 results)

  • [Journal Article] Zero-anaphor reslution by learning rich syntactic pattern features2007

    • Author(s)
      Ryu Iisa, Kentaro Inui, Yuji Matsumoto
    • Journal Title

      CM Transactions on Asian Language Information Processing 6

      Pages: 1-12

    • Peer Reviewed
  • [Journal Article] 関係データベースを用いた構文木付きコーパス検索手法2007

    • Author(s)
      橋本泰一, 吉田恭祐, 野口正樹, 徳永健伸, 田中穂積
    • Journal Title

      自然言語処理 14

      Pages: 3-22

    • Peer Reviewed
  • [Journal Article] Learning Based Argument Structure Analysis of Event-nouns in Japanese2007

    • Author(s)
      Mamoru Komachi, Ryu Iida, Kentaro Inui, Yuji Matsumoto
    • Journal Title

      Conference of Pacific Association for Computational Linguistics 10

      Pages: 120-128

    • Peer Reviewed
  • [Presentation] Corpus Annotation/Managetment Tools for the Project: Balanced Corpus of Contemporary Written Japanese2008

    • Author(s)
      Yuji Matsumoto
    • Organizer
      Third International Conference on Large-Scale Knowledge Resources
    • Place of Presentation
      東京工業大学
    • Year and Date
      2008-03-03
  • [Remarks]

    • URL

      http://www.tokuteicorpus.jp/g_tool/index.php

URL: 

Published: 2010-02-04   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi