本年は、定性的に災害現象を将来予測できる予測システムのプラットフォームの因果データベースを拡充する目的で、災害シナリオのダイナミック自動生成技術を高度化し、これに基づいていくつかの想定されたハザードをもとにした被災様相予測を行った。具体的には、新聞記事から災害事象の因果知識及び付随情報を抽出・整理する汎用的なプログラムを作成し、システムの高度化をはかるものである。ここでははじめに、自然言語処理・人工知能技術を活用した新聞記事からの因果判定・因果抽出の実装を行った。次に、場所・時間などの副次的な情報抽出の実装を行った。この点は、下記のような作業方針で行っている。①ルールベース手法(正規表現)により日付表現・時間表現を抽出し,リストとして属性付与、②固有表現コーパスをもとに固有表現抽出BERTを学習、③②の固有表現抽出BERTにより場所表現・施設表現を抽出し,リストとして属性付与、④ルールベースにより不適切な抽出は削除した上で,前文からの情報継承を行い、最終的に用いる属性を付与 (ア)「地震10時間後」など,発災をキーとして経過表現は、発災時刻をもとに時間を算出 (イ)「同市~町」などは前の文から「同市」にあたる部分を補完するなど,前文の情報も活用 (ウ)災害以前や記事翌々日以降の日付は削除 続いて、上記手法の精度検証・分析をしたのち、因果ネットワーク作成を含めた二次利用に向けたデータベースの整備を行った。最後に、データベース作成の再現が可能なプログラムの整備を行った
|