研究課題/領域番号 |
20K12077
|
研究機関 | 長岡技術科学大学 |
研究代表者 |
張 坤 長岡技術科学大学, 工学研究科, 准教授 (70784263)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
キーワード | オントロジー / 製品事故 / リスク情報 / ソサエティー5.0 |
研究実績の概要 |
研究実施計画において,令和2年度の目標は,①種々製品事故DBからリスク情報の抽出と標準化を行い本研究用のデータベースを作成する;②傷害情報記述枠組みコーディングマニュアル(IIDFCM:Injury Information Description Framework Coding Manual)に収録された国際標準語と自由記述文にある記述語のキャップをブリッジする用語集を作成するという二つがある.これに対して,以下の作業を実施した.①消費者庁の事故情報データバンクから2020年3月1日から2021年3月31日までの間に登録された注目事故情報2,611件事故(高齢者:2,254件;暖房器具:238件;乳幼児:97件;除雪機:22件)を抽出し,NITE事故検索DBからランダムに18,871件(高齢者:3,990件;子供の運搬器具:225件;非重大事故:970;燃焼器具:13,686)を抽出し,合計21,482件の製品リスクデータを収集した.②ブリッジする用語集の作成.SPSS TEXT Analytics For Surveysを用いて,NITE事故DBから抽出した225件の子供の運搬器具事故をブリッジ用語抽出のテストデータとして,品名(20個),危険源(146個),メカニズム(200個)と人の動作(207個)の四項目に対する673語のブリッジ用語の抽出を行った. このほか,③異なるDBの連携・統合のために,日本商品分類とICECIのオブジェクト分類とNITE事故検索DB品目・品名分類の三者間の製品名称の交換表も作成した.これは,本研究目的の一つである国際標準と整合的な形で製品リスク情報オントロジーの開発を達成するための準備作業となっている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
製品リスク情報・事故データベースを調査したうえ,消費者庁の事故情報データバンク,NITE事故検索データベースを本研究用の製品リスク情報データベースの母体として,代表的な多発事故事例21,482件のデータを集めた.②解決すべき課題中の「課題1:国際標準語と自由記述文にある記述語のキャップをブリッジする用語集の作成」に関しては試行作業を行った.結果としては225件の子供の運搬器具事故から,傷害情報を記述する要素のうちの四項目(品名,危険源,メカニズム,人の動作)に対する673個ブリッジ用語を抽出した.しかし,消費者庁の事故情報データバンクから抽出した事故の情報提供機関が多様であり,情報項目の不完全性や情報内容の欠落などにより,データの質にかなりのばらつきも生じているので,収集したデータの整合作業もブリッジ用語集作成用データの抽出作業も予想以上の時間がかかり,作成したブリッジ用語の数と種類は予定より少ない. また,既存の各製品事故データベースにおいて,製品名の分類も統一されておらず,異なる製品リスク情報データベースを連携・統合のためには,標準化された製品名語彙体系も必要となるため,本研究において取り込んだ製品事故データベース(NITE事故情報検索データベース,消費者庁の事故情報データバンク)と日本商品分類とWHOが開発した傷害の外因分類(ICECI:International Classification of External Causes of Injuries)のオブジェクト分類を用いて,これら製品分類語彙集の間の交換表を作成し,現時点では7割の作業を終了した.
|
今後の研究の推進方策 |
消費者庁の事故情報データバンクのデータとNITE事故検索データベースでは情報源と入力者レベルの違いがあり,質や情報内容の完全性などに関してかなりの差がある.これらのデータ連携・統合を円滑に行うために,「ヘビー・ウェイト・オントロジー(HWO: heavy weight ontology)」と「LWO: ライト・ウェイト・オントロジー(light weight ontology)」という二つのアプローチで研究を進めていく方策を取り込む予定である. HWOは哲学的な考察に基づき対象世界を論理的に適切に捉えることを重視し,人の手で情報を入力していく方法で,時間とコストがかかるというデメリットはあるが,完成した語彙集を用いた機械処理の精度が高いというメリットがある.HWOは特定の専門領域,情報の変化が少ない分野に適合性が高い.一方LWOは情報論的な利用効率を重視したオントロジーで,概念間の関係性を自動的に見つけていくので早くて使い勝手がよいというメリットがある一方,機械処理の精度はより低いというデメリットがあり,専門性の低い,大量データへのマイニング解析に適合性がある. 今後,収集した異なるデータ群の個性により,HWOとLWOの両手法を組み合わせて利用方法を模索しながら,製品リスク情報オントロジーの開発に挑戦していく.
|
次年度使用額が生じた理由 |
R2年度では, 新型コロナウイルスの影響で,ふさわしい研究補助者の雇用もできず、出張などの実施もできなかったため,次年度使用額が生じた. R3年度においては,本研究用のリスク情報データの収集・整理作業などの実施の遅れを調整するため, 次年度使用額を主に人件費として使用する予定である.
|