研究課題/領域番号 |
09680311
|
研究種目 |
基盤研究(C)
|
研究機関 | 岡山大学 |
研究代表者 |
垂水 共之 岡山大学, 環境理工学部, 教授 (50033915)
|
研究分担者 |
栗原 考次 岡山大学, 環境理工学部, 助教授 (20170087)
大竹 正徳 岡山大学, 環境理工学部, 教授 (40284088)
田中 豊 岡山大学, 環境理工学部, 教授 (20127567)
|
キーワード | 統計ソフトウェア / エキスパートシステム / データ辞書 / 事例データベース |
研究概要 |
データの本体以外に付随するデータに関する情報は、データ辞書として定式化できる。データ辞書は自由記述されることが多く、その意味はシソ-ラスを構成することにより明確化出来ることが多い。このため本研究では多くの解析事例を集め、そのデータ辞書を統合化することにより、シソ-ラスの構成を行うことを目的としている。 今年度はデータ辞書に含める記述項目を必須項目とオプショナル項目とに分類し、その記述項目を利用してデータ解析を行うソフトのプロトタイプを作成し、その有効性を示した。特にサンプリングの対象の母集団記述、観測した変量に関する記述は重要である。同じ「身長」という変量でも小学生を母集団とするか、大学生を母集団とするかで異常値の判定基準は自動的に変わる。またシソ-ラスを用いることにより、同じ測定対象である身長が「身長」という名前になっているか、「height」という名前になっているか、さらにその変量が「cm」という単位で測られているか、「m」という単位で測られているかにより、データの結合時に結合対象に出来るか否かを判定し、自動的に単位変換する機能が実現できた。 また、データ辞書の記述形式として、HTML言語に似た形式を採用することにより、ホームページを作成した経験のある利用者には簡単に辞書登録が行えるように配慮した。来年度は、変量名のシソ-ラスを拡充し、変量名から対象分野を限定し入力の手間を省く機能を追加する予定でいる。
|