研究課題/領域番号 |
09680311
|
研究機関 | 岡山大学 |
研究代表者 |
垂水 共之 岡山大学, 環境理工学部, 教授 (50033915)
|
研究分担者 |
栗原 考次 岡山大学, 環境理工学部, 助教授 (20170087)
大竹 正徳 岡山大学, 環境理工学部, 教授 (40284088)
田中 豊 岡山大学, 環境理工学部, 教授 (20127567)
|
キーワード | 統計ソフトウェア / エキスパートシステム / データ辞書 / 長例データベース |
研究概要 |
データの流通のためにはデータ本体のほかに、そのデータがどんな背景で、どんな目的で採られたか、どんな変量をどんな単位で測定したか等の付随情報が必要となる。これら、データの内容を記述したものは「データ辞書」と呼ばれるが、その記述内容,記述形式に定まった規定は無い。このため各人が思いつくままに記述しているのが現状である。データの流通のためにはこれを規格化する必要があり、昨年度はその記述内容を必須項目とオプショナル項目とに分類した。本年度はこの記述形式をHTMLを拡張したXML流の書き方に定め、この形式でデータ、およびその付随情報を記述することによりデータを交換・配賦するときの手間を省くと共に、そこから必要な情報を抜き出した「データ辞書」を構成するためのプロトタイプを作成した。HTMLは近年のインターネットのホームページでよく使われており、それを拡張したXML形式もポピュラーになっており記述は容易である。この記述形式を計算機統計学会をはじめとして、各種学会で発表し、改良をすすめると共に、広く普及を計る必要がある。適用分野として教育データをとりあげ、データ辞書の作成を試みてきたが、数値の単位についてはそれなりの結果を得ることができたが、変数名のシソーラスについては日本語処理との問題でまだ完成を見ていない。
|