1995 Fiscal Year Annual Research Report
品詞情報・構文情報を持った日本語中規模テキストコーパスの作成
Project/Area Number |
07558046
|
Research Category |
Grant-in-Aid for Developmental Scientific Research (B)
|
Research Institution | Kyoto University |
Principal Investigator |
長尾 真 京都大学, 工学研究科, 教授 (30025960)
|
Co-Investigator(Kenkyū-buntansha) |
角田 達彦 京都大学, 工学研究科, 助手 (10273468)
丸山 宏 日本IBM(株)東京基礎研究所, 研究員
黒橋 禎夫 京都大学, 工学研究科, 助手 (50263108)
|
Keywords | 自然言語処理 / テキストコーパス / 形態素解析 / 構文解析 |
Research Abstract |
本研究は種々の日本語分章の形態素解析、構文解析を通じて、我々の持っている形態素解析プログラム、構文解析プログラムの改良を行い、これらのプログラムを公開することを目的とする。また,これによって解析され文法情報を自動付与された日本語文章のデータベースを作成し、広く自然言語処理研究者に公開するものである。 平成7年度は2年間の研究期間の第一年目として以下のことを行なった. 1.形態素解析プログラムJUMAN、構文解析プログラムKNPについて相当規模の解析結果を調査することによってその誤りの傾向を明らかにした. 2.上記の調査をもとにして,特に形態素解析プログラムJUMANについて種々の改良を行ない,文章データベース作成のためのシステムとして十分な精度のシステムとした. 3.形態素解析、構文解析結果の見やすい表示と誤り部分の修正を簡単に行えるマンマシンのソフトウェアを開発した。 4.形態素解析、構文解析結果の日常的修正作業について、試行実験を行なった。 今後は、,構文解析プログラムKNPの改良を早急に行ない,大量文章の自動解析,その日常的修正作業の段階に入る予定である.
|