研究課題/領域番号 |
05558038
|
研究種目 |
試験研究(B)
|
配分区分 | 補助金 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 東京理科大学 |
研究代表者 |
藤崎 博也 東京理科大学, 基礎工学部, 教授 (80010776)
|
研究分担者 |
倉島 節尚 (株)三省堂, 出版局, 局長
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
広瀬 啓吉 東京大学, 工学部, 教授 (50111472)
亀田 弘之 東京工科大学, 工学部, 助教授 (00194994)
|
研究期間 (年度) |
1993 – 1994
|
研究課題ステータス |
完了 (1994年度)
|
配分額 *注記 |
9,100千円 (直接経費: 9,100千円)
1994年度: 2,900千円 (直接経費: 2,900千円)
1993年度: 6,200千円 (直接経費: 6,200千円)
|
キーワード | 高速・高精度検索 / 語彙知識の獲得 / 辞書データベース / 情報階層構造モデル / データベース管理システム / 未知語 / 語 知識の獲得 / 大規模テキストデータ / データ管理システム |
研究概要 |
1.単語辞書データの作成・整理: 新明解国語辞典(三省堂)をもとにデータを計算機上で加工・拡張して単語辞書データ(約17万語)を作成・整理した。 2.情報階層構造モデルにもとづく単語辞書の構築: 上記1のデータから処理対象分野に関連する単語からなる部分辞書を作成し、情報階層モデルにもとづき構造化した。 3.データベース管理システムの基本設計: データベース管理システム(検索部・変更部・追加部・獲得部・情報構造管理部・マンマシンインタフェイス部)の基本設計を行った。 4.データベース管理システムの実装とその基本的動作の確認: 上記3の各部を、C言語を用いて辞書データベース構築用装置上に実装した。 5.辞書データの詳細仕様の決定と実装: データ形式の仕様を決定し、上記2で作成した辞書データをこれにもとづいて加工し、辞書データベース構築用装置上に格納した。 6.検索部・獲得部の実装と評価: プログラミング言語Cとprologとを用いて検索部と獲得部とを辞書データベース構築用装置上に実装した。 7.辞書データベースの作成: 上記5と6の成果を統合し、辞書データベースを作成し、検索速度・精度の点で従来の検索システムとの比較評価を行い、これらの点における本システムの優位性を確認した。 8.辞書データベースの有効性の検証: 辞書データベースを形態素解析に適用し、新聞記事文と天気概況文とを素材として評価を行った結果、検索速度・精度および未知語獲得機能の両方において、所定の性能が実現されたことを確認し、本データベースの有効性を検証した。
|