• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

言語研究のためのコーパスの作成と利用に関する研究

Research Project

Project/Area Number 15300046
Research InstitutionNara Institute of Science and Technology

Principal Investigator

松本 裕治  奈良先端科学技術大学院大学, 情報科学研究科, 教授 (10211575)

Co-Investigator(Kenkyū-buntansha) 浅原 正幸  奈良先端科学技術大学院大学, 情報科学研究科, 助手 (80379528)
橋本 喜代太  大阪女子大学, 人文社会学部, 助教授 (50278818)
投野 由紀夫  明海大学, 外国語学部, 助教授 (10211393)
大谷 朗  大阪学院大学, 情報学部, 講師 (50283817)
Keywords言語コーパス / 言語処理 / 品詞タグ付け / 係り受け解析 / データベース / 単語検索 / KWIC
Research Abstract

日本語および英語の品詞タグ付けや係り受け解析を行う言語処理ツールを開発するとともに,それの解析結果と辞書を連携して格納し,管理と検索を行うためのシステムの実装を行った.本年はダグ付きコーパスと辞書の連携管理を行う機能の設計と実装,および係り受け解析結果の検索機能の実装を重点的に行った.具体的に作成した機能は次の通りである.
1.品詞タグ付けコーパスと辞書を関係データベースに格納し,品詞タグ付けコーパスを辞書項目へのポインタ列として実装する機能.
2.単語列検索機能:格納されたテキストを任意の単語列を,単語がもつ任意の属性(出現形,読み,発音,階層構造付きの品詞,活用型,活用形)を部分的に指定して検索する機能.前年度に実装したこの検索機能を新しいデータベースに対応するように修正した.
3.単語検索結果の前後の文脈中に現れる他単語との統計的共起尺度を計算する機能.
4.係り受け解析されたコーパスを関係データベースに格納する機能.
5.任意の係り受け構造を指定して,それにマッチする部分構造を持つ文を網羅的に検索する機能.
これらの機能の洗い出しやデータベースの設計,検索手法や統計的共起情報の計算法を議論するため,年度内に奈良,東京,大阪で合計8回の全体会合をもった.また,記述的な問題については,奈良先端大のメンバーで週に1回の内部会合を開いて,詳細を議論した.
上記機能を実装したシステムを第2版として年度明けに公開する予定である.

  • Research Products

    (6 results)

All 2005 2004

All Journal Article (6 results)

  • [Journal Article] タグ付きコーパスの管理/検索ツール「茶器」の現状2005

    • Author(s)
      松本裕治, 浅原正幸, 河部恒, 高橋由梨加, 投野由紀夫, 大谷朗, 森田敏生
    • Journal Title

      言語処理学会年次大会 11

  • [Journal Article] 日本語固有表現抽出におけるわかち書き問題の解決2004

    • Author(s)
      浅原正幸, 松本裕治
    • Journal Title

      情報処理学会論文誌 45・5

      Pages: 1442-1450

  • [Journal Article] Support Vector Machineを用いた決定性上昇型依存構造解析2004

    • Author(s)
      山田寛康, 松本裕治
    • Journal Title

      情報処理学会論文誌 45・10

      Pages: 2416-2427

  • [Journal Article] Japanese Unknown Word Identification by Character-based Chunking2004

    • Author(s)
      Masayuki Asahara, Yuji Matsumoto
    • Journal Title

      Proceedings of 20th International Conference on Computational Linguistics 20

      Pages: 459-465

  • [Journal Article] Pruning False Unknown Words to Improve Chinese Word Segmentation2004

    • Author(s)
      Chooi-Lirg Goh, Masayuki Asahara, Yuji Matsumoto
    • Journal Title

      Proceedings of the 18th Pacific Asia Conference on Language, Information and Computation 18

      Pages: 139-149

  • [Journal Article] 茶筌と南瓜による日本語解析-構文情報を用いた文の役割分類2004

    • Author(s)
      松本裕治, 高岡一馬, 浅原正幸, 工藤拓
    • Journal Title

      人工知能学会誌 19・3

      Pages: 334-339

URL: 

Published: 2006-07-12   Modified: 2013-10-17  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi