1994 Fiscal Year Annual Research Report
高速・高精度の検索機能と語 知識の獲得機能とを有する辞書データベースの試作
Project/Area Number |
05558038
|
Research Institution | The Science University of Tokyo |
Principal Investigator |
藤崎 博也 東京理科大学, 基礎工学部, 教授 (80010776)
|
Co-Investigator(Kenkyū-buntansha) |
倉島 節尚 (株)三省堂, 出版局, 局長
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
広瀬 啓吉 東京大学, 工学部, 教授 (50111472)
亀田 弘之 東京工科大学, 工学部, 助教授 (00194994)
|
Keywords | 高速・高精度検索 / 語 知識の獲得 / 辞書データベース / 未知語 |
Research Abstract |
本年度は、当初の計画・方法に従って研究を推進し、以下の成果を収めた。 1.辞書データの詳細仕様の決定:辞書データベースのデータは、品詞名・表記・読み・意味・既知単語か獲得単語かの別、を可変長形式で記述するように決定した。 2.検索・獲得部の実装と評価:辞書データベースの検索部と獲得部とをプログラミング言語Cとprologとを用いて記述するとともに、これを辞書データベース構築用装置上に実装した。また、前年度作成した辞書データを素材として検索・獲得部の評価を行い、その基本的有効性を確認した。 3.最終的な辞書データの作成:前年度作成した辞書データを、上記1の仕様に従って加工し、これを辞書データベース構築用装置上に格納するとともに、辞書データ中の誤りを既存の文字列検索ツール(awkとsed)を利用して検出し修正を行い、最終的な辞書データとした。 4.辞書データベースの作成:上記2と3にもとづき、辞書データベースを辞書データベース構築用装置上に作成し、その基本的な動作(高速・高精度検索および未知語獲得)を確認するとともに、検索速度・精度の点で従来の検索システムとの比較評価を行い、これらの点における本システムの優位性を確認した。 5.辞書データベースの有効性の検証:上記4で作成した辞書データベースを日本語漢字仮名交じり文の形態素解析に適用し、新聞記事文と天気概況文とを素材として評価を行った。その結果、検索速度・精度および未知語獲得機能の両方において、所定の性能が実現されたことを確認し、本データベースの有効性を検証した。
|
Research Products
(3 results)
-
[Publications] 横田和章: "コーパスに基づく構文木の自動生成法" 電子情報通信学会総合大会情報・システム部門講演論文集. 1. 120 (1995)
-
[Publications] 亀田弘之: "べた書き日本語文からの未知語獲得システムの試作" 電子情報通信学会技術研究報告「思考と言語」TL94-11. 17-24 (1994)
-
[Publications] 亀田弘之: "統語解析処理にもとづく未知語獲得システムの試作" 電子情報通信学会総合大会基礎・境界部門講演論文集. 474 (1995)