研究課題
1.データベース化の対象とする文部省刊行の学校基本調査報告書のうち、昭和50年度から昭和62年度間の13年分の報告書に掲載された統計データの構造を分析した。(1)統計数値の個数は約680万個、統計表の表頭は459種類、表側は469種類、統計表は1410種類である。(2)統計表の1行を1レコードとし、1レコードに最大63個までの数値を固定長で収録すると、全体で約39万レコードとなり、1個の数値を8バイトとし、各レコードに識別コードを付してコンピュータに入力すると、約300MBの容量が必要となる。(3)将来、30年間の学校基本調査の統計数値を1枚約500MB収録可能なCDーROMに登載するためには、可変長レコードないしバイナリ形式で記憶することを検討する必要がある。2.多量の統計数値を高速で検索するシステムを設計・開発した。(1)高速検索の実現するためのインデックスファイルとして、調査対象の検索に関するもの、集計事項の種類の検索に関するもの、統計表の種類と統計数値の所在の検索に関するもの、および、表頭・表側の記述事項の検索に関するものの、計4種類を設計した。(2)統計数値データおよび、集計事項、表頭・表側事項に関するデータを入力してインデックスファイルを作成する汎用コンピュータ用ソフトウェアと、CDーROM登載用データのコード変換ソフトウェア、および、CDーROMに登載した統計数値を各種のインデックスファイルを用いて検索するソフトウェアを開発した。3.検索用ソフトウェアの稼働テスト用として小量のデータについてのCDーROMファイルと、高速検索の実証用として前記13年分の全データについてのものを作成した。
すべて その他
すべて 文献書誌 (1件)