従来の事故データ収集システムでは、質問項目の設計に不備があるため、事故予防に生かせていないという問題点がある。そこで、現在あるデータを分析し、事故を扱うのに必要な項目を選定することが重要であると考え、共同研究を行っている小児科医の山中氏の協力を得て、事故データ約3000件を提供して頂き、分析を行った。質問項目によって集められる情報が、事故を表現するパラメータとして重要かどうかを定量的に評価するために、相互情報量を用いて分析を行った。結果の一例としては、事故に関係があった物体や事故の原因となった行動は情報量が高く、性別は情報量が低いことが分かった。同様の分析を対象とするパラメータを変更して行い、質問項目の選定を行った。 また、事故データ収集システムの問題として、(1)回答の選択肢が多いため入力作業が煩雑であること、(2)入力が煩雑なために十分に情報が入力されないというものがある。(1)の問題に関しては、相互情報量を用いた分析を行うことにより、事故に関連するパラメータ問の関係性を明らかにし、質問に回答していくと、それ以降の質問項目に関しては、回答を推論し、可能性が高い順に選択肢を並べ替える機能を実装した。また、(2)の問題に関しては、(1)の問題の解決策で改善は見込めるものの、全てのケースに関して、完全にデータを入力することは不可能であることから、質問項目を重要な順に並べることで、入力が途中までしかされておらず、回答された項目が少ない場合でも、そこから重要な情報を得ることができるように設計した。以上の分析をもとにしたソフトウェアを開発した。 開発したソフトウェアを使い収集した事故データの分析を行った結果、得られつつある成果としては、モノと事故の関係を、ベイジアンネットワークで表現した。このネットワークでは、モノを特徴量(熱い・とがっている・大きさなど)で表現することによって、過去の事故データには存在しないモノでも特徴量をふることができれば、どのような事故が起こるかを推論することが可能である。このように、事故データを再利用可能な形にすることが可能である。
|