• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

1994 Fiscal Year Annual Research Report

高速・高精度の検索機能と語 知識の獲得機能とを有する辞書データベースの試作

Research Project

Project/Area Number 05558038
Research InstitutionThe Science University of Tokyo

Principal Investigator

藤崎 博也  東京理科大学, 基礎工学部, 教授 (80010776)

Co-Investigator(Kenkyū-buntansha) 倉島 節尚  (株)三省堂, 出版局, 局長
大野 澄雄  東京理科大学, 基礎工学部, 助手 (80256677)
広瀬 啓吉  東京大学, 工学部, 教授 (50111472)
亀田 弘之  東京工科大学, 工学部, 助教授 (00194994)
Keywords高速・高精度検索 / 語 知識の獲得 / 辞書データベース / 未知語
Research Abstract

本年度は、当初の計画・方法に従って研究を推進し、以下の成果を収めた。
1.辞書データの詳細仕様の決定:辞書データベースのデータは、品詞名・表記・読み・意味・既知単語か獲得単語かの別、を可変長形式で記述するように決定した。
2.検索・獲得部の実装と評価:辞書データベースの検索部と獲得部とをプログラミング言語Cとprologとを用いて記述するとともに、これを辞書データベース構築用装置上に実装した。また、前年度作成した辞書データを素材として検索・獲得部の評価を行い、その基本的有効性を確認した。
3.最終的な辞書データの作成:前年度作成した辞書データを、上記1の仕様に従って加工し、これを辞書データベース構築用装置上に格納するとともに、辞書データ中の誤りを既存の文字列検索ツール(awkとsed)を利用して検出し修正を行い、最終的な辞書データとした。
4.辞書データベースの作成:上記2と3にもとづき、辞書データベースを辞書データベース構築用装置上に作成し、その基本的な動作(高速・高精度検索および未知語獲得)を確認するとともに、検索速度・精度の点で従来の検索システムとの比較評価を行い、これらの点における本システムの優位性を確認した。
5.辞書データベースの有効性の検証:上記4で作成した辞書データベースを日本語漢字仮名交じり文の形態素解析に適用し、新聞記事文と天気概況文とを素材として評価を行った。その結果、検索速度・精度および未知語獲得機能の両方において、所定の性能が実現されたことを確認し、本データベースの有効性を検証した。

  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] 横田和章: "コーパスに基づく構文木の自動生成法" 電子情報通信学会総合大会情報・システム部門講演論文集. 1. 120 (1995)

  • [Publications] 亀田弘之: "べた書き日本語文からの未知語獲得システムの試作" 電子情報通信学会技術研究報告「思考と言語」TL94-11. 17-24 (1994)

  • [Publications] 亀田弘之: "統語解析処理にもとづく未知語獲得システムの試作" 電子情報通信学会総合大会基礎・境界部門講演論文集. 474 (1995)

URL: 

Published: 1996-04-08   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi