• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

1995 年度 実績報告書

品詞情報・構文情報を持った日本語中規模テキストコーパスの作成

研究課題

研究課題/領域番号 07558046
研究種目

試験研究(B)

研究機関京都大学

研究代表者

長尾 真  京都大学, 工学研究科, 教授 (30025960)

研究分担者 角田 達彦  京都大学, 工学研究科, 助手 (10273468)
丸山 宏  日本IBM(株)東京基礎研究所, 研究員
黒橋 禎夫  京都大学, 工学研究科, 助手 (50263108)
キーワード自然言語処理 / テキストコーパス / 形態素解析 / 構文解析
研究概要

本研究は種々の日本語分章の形態素解析、構文解析を通じて、我々の持っている形態素解析プログラム、構文解析プログラムの改良を行い、これらのプログラムを公開することを目的とする。また,これによって解析され文法情報を自動付与された日本語文章のデータベースを作成し、広く自然言語処理研究者に公開するものである。
平成7年度は2年間の研究期間の第一年目として以下のことを行なった.
1.形態素解析プログラムJUMAN、構文解析プログラムKNPについて相当規模の解析結果を調査することによってその誤りの傾向を明らかにした.
2.上記の調査をもとにして,特に形態素解析プログラムJUMANについて種々の改良を行ない,文章データベース作成のためのシステムとして十分な精度のシステムとした.
3.形態素解析、構文解析結果の見やすい表示と誤り部分の修正を簡単に行えるマンマシンのソフトウェアを開発した。
4.形態素解析、構文解析結果の日常的修正作業について、試行実験を行なった。
今後は、,構文解析プログラムKNPの改良を早急に行ない,大量文章の自動解析,その日常的修正作業の段階に入る予定である.

  • 研究成果

    (1件)

すべて その他

すべて 文献書誌 (1件)

  • [文献書誌] 黒橋 禎夫: "連語登録による形態素解析システムJUMANの精度向上" 言語処理学会 第2回年次大会. (1995)

URL: 

公開日: 1997-02-26   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi