• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2005 Fiscal Year Annual Research Report

言語研究のためのコーパスの作成と利用に関する研究

Research Project

Project/Area Number 15300046
Research InstitutionNara Institute of Science and Technology

Principal Investigator

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

Co-Investigator(Kenkyū-buntansha) 浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80379528)
橋本 喜代太  大阪府立大学, 人間社会学部, 助教授 (50278818)
投野 由紀夫  明海大学, 外国語学部, 教授 (10211393)
大谷 朗  大阪学院大学, 情報学部, 助教授 (50283817)
Keywordsコーパス / 自然言語処理 / 品詞タグ付け / 係り受け解析 / データベース / 検索 / 多言語処理 / KWIC
Research Abstract

言語解析ツールに関する研究として,これまで開発してきた日本語の形態素解析,係り受け解析システムを中国語の品詞タグ付けおよび単語係り受け解析システムとして実装した.
また,辞書の整備については,中国語の未知語解析法の整備を行い,大量のテキストデータから未知語を抽出する実験を行い,10万語を越える大規模な中国語辞書を作成した.また,日本語の複合表現の辞書への登録に関する基準を設定して複合語辞書の整備を行い,複合語の内部構造を記述した日本語辞書を作成した.英語についても,複合表現の品詞推定についての実験を行い,複合表現が字義的に使われているかどうかを自動判定する手法について高い精度を与える成果を得た.
コーパス管理ツールについては,タグ付き言語データと辞書項目の関連付けと関係データベースへの格納のフォーマットの詳細化を行い,これまで開発してきたタグ付きコーパス管理システムに実装した.コーパス中の単語分かち書きおよび品詞タグ付けに関する誤りを修正するためのインタフェースの設計と実装を行った.係り受け解析が行われた文のデータベースへの格納法を決定し,また,係り受け構造を表示するためのインタフェースの実装を行った.さらに,そのインタフェースを用いて,文節のまとめあげと係り受けに関するタグ付け誤りを修正する機能を実装した.
構築したタグ付きコーパス管理システムの諸機能の使い易さと正しさの検証を行うために,利用者を募った講習会を年度内に2回開催し,利用者からのフィードバックを得た.同時に,開発したシステムをWebからダウンロードできる形で一般公開した.

  • Research Products

    (6 results)

All 2005

All Journal Article (6 results)

  • [Journal Article] Chinese Word Segmentation by Classification of Characters2005

    • Author(s)
      Chooi-Ling Goh, Masayuki Asahara, Yuji Matsumoto
    • Journal Title

      International Journal of Computational Linguistics and Chinese Language Processing 10・3

      Pages: 381-396

    • Description
      「研究成果報告書概要(和文)」より
  • [Journal Article] 相対的な係りやすさを考慮した日本語係り受け解析モデル2005

    • Author(s)
      工藤拓, 松本裕治
    • Journal Title

      情報処理学会論文誌 46・4

      Pages: 1082-1092

  • [Journal Article] 単語レベルと文字レベルの情報を用いた中国語・日本語単語分割2005

    • Author(s)
      中川哲治, 松本裕治
    • Journal Title

      情報処理学会論文誌 46・11

      Pages: 2714-2727

  • [Journal Article] ChaKi: An Annotated Corpora Management and Search System2005

    • Author(s)
      Yuji Matsumoto, Masayuki Asahara, Kou Kawabe, Yurika Takahashi, Yukio Tono, Akira Ohtani, Toshio Morita
    • Journal Title

      Proceedings from the Corpus Linguistics Conference Series 1・1

  • [Journal Article] Automatic Extraction of Fixed Multiword Expressions2005

    • Author(s)
      Campbell Hore, Masayuki Asahara, Yuji Matsumoto
    • Journal Title

      Natural Language Processing, Second International Joint Conference, Lecture Notes in Artificial Intelligence 3651

      Pages: 565-575

  • [Journal Article] Chinese Deterministic Dependency Analyzer: Examining Effects of Global, Features and Root Node Finder2005

    • Author(s)
      Yuchang Cheng, Masayuki Asahara, Yuji Matsumoto
    • Journal Title

      Fourth SIGHAN Workshop on Chinese Language Processing, Proceedings of the Workshop 4

      Pages: 17-24

URL: 

Published: 2007-04-02   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi