研究課題/領域番号 |
07458076
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
情報システム学(含情報図書館学)
|
研究機関 | 学術情報センター |
研究代表者 |
高須 淳宏 学術情報センター, 研究開発部, 助教授 (90216648)
|
研究分担者 |
佐藤 真一 学術情報センター, 研究開発部, 助手 (90249938)
相沢 彰子 (相澤 彰子) 学術情報センター, 研究開発部, 助教授 (90222447)
|
研究期間 (年度) |
1995 – 1997
|
研究課題ステータス |
完了 (1997年度)
|
配分額 *注記 |
5,000千円 (直接経費: 5,000千円)
1997年度: 1,500千円 (直接経費: 1,500千円)
1996年度: 1,500千円 (直接経費: 1,500千円)
1995年度: 2,000千円 (直接経費: 2,000千円)
|
キーワード | 確率文法 / 文書画像理解 / 電子図書館 / 書誌照合 / 文書画像処理 / データベースシステム / 近似マッチング / 情報検索 / パターンマッチング |
研究概要 |
近年の情報処理技術の進歩、特に画像解析技術の進歩によって、従来のテキストにとどまらず、画像データを大量に蓄積し配布することが可能になってきている。本研究は、今後大きな需要が予想される画像を中心とした学術情報データベースの構築法の研究を目的としている。この研究では、画像データベースの構築、管理、利用の各課題についての個別的な研究を進めるとともに、これらの要素技術を統合しシステムにまとめ上げる統合化技術についての研究を進めた。まず、学術画像データベースの構築支援手法として、文書画像の解析と構造抽出を自動的に行うための手法についての研究をすすめた。ここでは、2次元平面上にレイアウトされた文書の構成要素を解析するための文法と解析手法を提案した。また、画像データの蓄積技術として、文書画像データの獲得過程で生じる認識誤りを扱うための近似的マッチング手法について研究を行い、N gramベースのインデキシング手法を提案した。蓄積された情報の活用方法として、書誌情報に着目し、その照合・同定方法について研究し、文書中に現れる各種の書誌情報と書誌データベースの情報を統合するシステムを試作し、提案手法の有効性を確認した。
|