1)中小企業の財務データに対して多重代入法を用いて欠測を補完し多くの情報を活かせるようなデータベースを構築した。2)特定の財務変数は極端に大きな値、負の値、ゼロ近辺でのクラスターなどが混在し理想的なガウジアン分布とは程遠く、共分散を歪める可能性がある。正規分布への変換方法として,正の値のみならず負の値まで考慮できるneglog変換を行うことで,元々の尺度では隠れていた特徴を際立たせ,変数の分布を改善させた。3)信用リスク計測に必要な指標を、財務情報に加えて、企業の独自情報を使って推測した。4)中小企業財務データには外れ値が含まれるが、外れ値を除外せずに、影響を小さくするロバスト推定を行った。
|