研究課題/領域番号 |
07558274
|
研究種目 |
基盤研究(A)
|
配分区分 | 補助金 |
応募区分 | 試験 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 東京理科大学 |
研究代表者 |
藤崎 博也 東京理科大学, 基礎工学部, 教授 (80010776)
|
研究分担者 |
倉島 節尚 (株)三省堂, 出版局(データベースシステム研究開発), 常務取締役出版局長
大野 澄雄 東京理科大学, 基礎工学部, 助手 (80256677)
亀田 弘之 東京工科大学, 工学部, 助教授 (00194994)
|
研究期間 (年度) |
1995 – 1996
|
研究課題ステータス |
完了 (1996年度)
|
配分額 *注記 |
2,100千円 (直接経費: 2,100千円)
1996年度: 2,100千円 (直接経費: 2,100千円)
|
キーワード | 語彙獲得 / 辞書データベース / 未知語 / 知識の獲得 / 未知語処理 / prolog / 自然言語処理 / 機械学習 / 辞書データベースシステム / 未知語検出 / 未知語品詞推定 / 知識獲得 |
研究概要 |
本研究の基本構想は、あらかじめ準備した辞書データをもとに、機械が未知語を検出し、その品詞と意味とを推定することのできる辞書データベースを作成することである。この基本構想のもと平成7〜8年度の研究期間に、当初の計画・方法に従って研究を推進し、以下の成果を収めた。 〔平成7年度〕 1.大規模な辞書データと新聞記事データの整理:既存の大規模単語辞書データに対して、複数の辞書のデータを参照して、辞書データの整理を行った。また、予め作成した新聞記事データに関して、形式上の統一のための整理を行った。 2.意味体系を記述するデータ構造の決定と意味体系データの整理:EDR電子化辞書を基に、高度辞書データベースシステムで使用する意味記述用データ構造を決定するとともに、意味体系データをの整理した。 3.未知語自動検出部の設計と実装:未知語を自動的に検出するプログラムを設計し、これを未知語自動検出部作成用装置上に実装した。 4.未知語品詞意味推定部の設計と実装:上記3のプログラムに対して、未知語の品詞と意味とを自動推定するような改良を加え、これに基づき未知語品詞意味推定部の設計・実装を行った。 5.高度辞書データベースシステムの基本部分の実装と予備評価:上記1〜4の研究成果を統合し、高度辞書データベースシステム(基本部分)を実装・予備評価を行い、基本的有効性を確認した。 〔平成8年度〕 1.辞書データベースシステムの詳細仕様の決定:高度辞書データベースに格納する辞書データの容量、および未知語自動検出部、未知語品詞意味推定部の仕様の詳細を決定した。 2.辞書データの詳細仕様の決定:高度辞書データベースに格納する辞書データの内容と形式とを、詳細にわたり決定した。 3.高度辞書データベースシステムの作成:平成7年度の成果と上記1と2の仕様にもとづき、高度辞書データベースシステムを構築した。 4.高度辞書データベースシステムの評価:作成した辞書データと、新聞記事等の電子化テキストを利用して、システムの処理性能評価実験を行った。その結果、処理精度・処理速度の観点から、本システムの基本的有効性を確認した。
|