研究概要 |
本研究は情報検索用標準プロトコルZ39.50に基づく日本語書誌データ検索システムを構築した。Z39.50は検索の際のクライアントとサーバ間で通信されるデータ構造やデータ処理方式について取り決めたANSIおよびISOの規格である。Z39.50に基づいて検索システムを構築することにより、検索システム間の相互接続が可能になり、情報資源を共有できる。本システムはクライアントとサーバから構成される。クライアントは検索語の日本語入力および表示が可能で、世界中のZ39.50サーバに接続できる。サーバはコントロールモジュール、プロトコルエンジン、検索エンジン、データベースから構成され、データベースはさらにインデックス部とJapan/MARCレコードから構成される。Z39.50のクライアントとサーバはAPDU(Application Protocol Data Unit)と呼ばれる情報フレームを用いて通信する。本システムは日本語誌データJapan/MARCの検索を可能にするため、検索エンジンおよびデータベースで日本語処理を行うとともに、クライアントでの日本語入力が行えるようにした。Japan/MARCデータは1983年から1998年5月までの配布分1,019,696レコードを使用した。Japan/MARCレコードをプレインテキストとして1レコード1ファイルに変換し、タグフィールドごとに索引づけを行った。索引語は日本語解析ツール「茶筅」を用い、索引づけは「Namazu」を用いた。本研究によって日本語データを含む情報資源の共有が可能になった。
|