研究概要 |
この研究の目的は,柴山(1993)の提案した不完全データのための主成分分析法を,計算機の機種やオペレーティング・システムになるべく依存せず実行できるFortran77プログラムを開発することにある。このモデルは多変量正規分布などの強い仮定を設けず,データ行列中の欠測(欠損)部分の補完を避け,観測値のみを直接利用して多変量データの変動を縮約する統計的モデルである。 プログラムの開発は主としてIBM‐PC750‐P90によって行われ,順調に開発を終えることができた。プログラムはFortran77言語の標準的なステートメントで書かれている。そのため目的どおりコンパイラーさえあれば様々なコンピュータ機種・OSのもとで実行可能となる。実際,確認できた実行可能なOSは,PC‐DOS Ver.6.0,NEC日本語MS‐DOS,FreeBSD(98)2.0.5,Sun OS Ver.4.0の多岐に及んでいる。このプログラムは,欠測値(欠損値)を含むデータ行列を入力すれば,おもな出力情報として1)数値最適化の経過,2)重み係数行列,3)加算定数ベクトル,4)成分スコア行列,5)近似行列などを得ること機能を持っている。 研究成果をまとめた報告書はすでに完成し,プログラムとともに平成8年度初めには公開・配布する予定で準備が進められている。報告書の内容は,上記モデルの理論的な解説,計算アルゴリズム,今回開発されたFortran77プログラムの使用方法と全ソース・リスト,同じ機能を持ったSAS/IMLプログラムの使用方法とソース・リスト,さらに不完全多変量データのEM法による平均ベクトルと分散共分散行列の推定プログラムのソース・リストからなっている。これらのプログラム群は不完全多変量データの統計的分析に関する理論的研究を進めていく上でも,実際のデータ解析の上でも役立ちうるものである。
|