研究概要 |
本年度は,前年度に開発したS上のデータ解析環境を実際データで検証することを中心に研究を進めた.対象としたデータは,マーケティング・データ,金利データ,地震データ,薬学データである. マーケティング・データは,1992年後半の全国大小のスーパーマーケット139店での保存食品9品目の売上高と売上量の13週分のデータであるが,従来のような商品あるいは品目,週ごとの断面的な解析ではなく,16,250件のデータすべてをの一括したモデル化を行った. 金利データは,1982年9月から1986年12月までの7種類の円金利の目次データであり,これも14,469件にのぼるデータを一括して,スムージングと多変量自己回帰モデルによりモデル化した. 地震データは,気象庁が収集した日本全国で発生した地震すべてのデータであり,159,877件にのぼる,位置,深さ,マグニチュードのデータである.これに関してもポアソン過程やフラクタル,混合分布などによるモデル化を行ったが,その性格上,地域的な属性による差異が大きく,地域ごとのモデル化が必要となった. 以上モデル化を行った3種類のデータの共通点は,その量の多さと複雑さにある.そのため,これまで本格的な解析が困難とされてきたが,我々の開発した解析環境ならば十分,有効な解析が行えることが明らかになった.一方,薬学データは量こそ少ないものの,その影響の大きさから,慎重なモデル化が要求される.このようなデータに対しても,我々の開発した対話型の環境は十分強力であることが確かめられた.
|