研究概要 |
(1)ファサードデータベースの構築:前年度の継続として、ビテオカメラで撮影したファサード映像から、ファサードの立面画像データベースを構築した。 (2)説明変数の構築:空間の可視性や交通量など、街頭犯罪に関連すると思われる特徴量でデータ化されていないものに関して、各地点で計算した。 (3)説明変数の分析:一般に,すべての説明変数を用いて学習モデルを作成するのは,変数間の相関性の点から望ましくないので,モデルの学習/予測精度を確認し,犯罪発生を説明する最小限の説明変数を選択する。一般的なForward/Backword型のStepwise法の他,CfsSubset Eval法などの高速な変数選択アルゴリズムを用いて,どのアルゴリズムがデータベースに適合しているのかを比較した。 (4)空間構成ルールの獲得:Emergence Patternsなどの希少ルール発見形の相関ルールや,決定木などの分類木アルゴリズムを用いて,犯罪発生に関係の深い空間構成ルールを獲得した。決定木などの一般的な学習アルゴリズムは,フリーのデータマイニングソフトWekaに実装されているものを用いたが,Emergence Patternsは実装が無いのでアルゴリズムを自作した。獲得されたルールをSupport(被覆率)とConfidence(確信度)の2面から評価し,特に,Supportが小さくConfidenceが大きいルールに着目して分析した。 (5)犯罪予測モデルの構築と危険度分布:ロジスティック回帰などの確率的な学習アルゴリズムを用いて,各地点の犯罪発生確率モデルを構築した。犯罪発生地点は非発生地点と比較して少ないので,コスト考慮型学習法を介在させて,犯罪発生地点の誤分類コストを上げた学習を行った。構築されたモデルから,各地点の犯罪発生確率を求め,犯罪マップと比較して,特に局地的な部分の相違点について比較しモデルの有効性を検証した。
|