研究課題
今年度は3自治体からデータ提供をしてもらい、当初予定していた内容について研究を行った。【成果1】 通告件数の予測については、ベイズ推論に基づく予測を行った。時系列データにおけるトレンドを分析すると、正弦加法に基づく増加が各自治体の特徴として見いだされた。しかし、各自治体の相談所毎の階層化をした場合には、通告が元々少ない相談所の場合はサンプリングの問題が発生するため、通告件数が少ない自治体については誤差範囲を広く取った対応が必要となった。今後は、データの追加はもちろんのこと、階層化を含めた最適化を来年度行う必要がある。【成果2】Caseloadの予測シミュレーションについては、機械学習による勾配ブ-スティングを行った。Caseloadの予測には、実際にどのようなケースなのかというリスクアセスメント各項目のデータが必要不可欠である。そのため、3自治体のうち1自治体のデータ構造でないと的中率の精度を維持できなかった。また、各自治体のデータベース構造には、各ベンダー毎の違いがあり、標準化されたデータベースになっていない。その点についてはアルゴリズムの精緻化に尽力するよりは、自治体と連携し、標準化されたデータベースを先に同時並行で進めることが必要不可欠と考えられる。
2: おおむね順調に進展している
データ提供を含めて、具体的な研究状況としては、今年度は概ね順調に進展している。研究成果の概要で述べたように、各自治体のベンダー毎のデータベース構造の違いが想像以上に強く、他の自治体についてもデータクレンジング期間を十分に取っておく必要が重要な気づきであった。
来年度は自治体の数をさらに増やしデータを拡大することで、当所の予定の通り、通告通告予測、Caselod予測の対応を行っていく。ただし、全国児童相談所所長会のデータ使用が可能なため、内容については昨年度構築したアルゴリズムを全国児童相談所所長会のデータにも適応できるかについて検討を行う。
すべて 2018
すべて 学会発表 (2件) (うち国際学会 1件)