研究課題/領域番号 |
20H02410
|
研究機関 | 東京大学 |
研究代表者 |
廣井 悠 東京大学, 大学院工学系研究科(工学部), 准教授 (50456141)
|
研究分担者 |
関谷 直也 東京大学, 大学院情報学環・学際情報学府, 准教授 (30422405)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 機械学習 / 災害連鎖 |
研究実績の概要 |
本研究は、新聞記事などの文章から災害の連鎖構造を抽出する方法論を確立するものである。ここでは、手がかり表現と継起因果表現の2種類の表現方法を用いて抽出された因果関係文の候補に対して、機械学習による判別モデルを作成するもので、そのうえで、判別された因果関係文に対して、それら文の原因部分と結果文をノードとリンクとして災害因果ネットワークを作成する。 とくにここで開発した独自の手法は、継起因果表現による連鎖構造の抽出である。継起因果表現とは、時間的な前後関係を表す継起関係に因果関係も含まれるものである。例えば、「高速道路やビルが倒壊して、道路をふさぎ消防車も入れなかった」という記事の文章のなかには、前述の手がかり表現は見られないが、「高速道路やビルが倒壊して」が原因、「道路をふさぎ消防車も入れなかった」が結果という関係が含まれている。ここでは日本語の新聞記事から8種類の継起因果表現を用いて因果文の候補を抽出する手法を試みた。ただ、この段階で抽出された文の中には因果知識が含まれていないものがある可能性がある。そこで、特定の災害に関して、それぞれ発生後1カ月間の記事で抽出された因果文の候補のうち約3分の1にあたる量の文に対して因果関係の有無についてアノテーションを付けることとした。そしてこのうち70%を学習用、残り30%をテスト用とした。これら因果関係の有無を目的変数として、SVMを用いた機械学習モデルを構築した。 災害連関図の作成については、各判別モデルで抽出された因果関係文について原因部と効果部に分けられた因果データベースを用いて因果ネットワークを作成する。そして、この終点ノードを原因として因果データベースから結果を検索して、終点ノードに新しい終点ノードを追加することで因果ネットワークを更新する。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
開発した方法論の精度も高く、おおむね順調に進展していると考えられる。一方でコロナ禍により、ワークショップによる検証などができなかった点は、次年度以降の課題である。
|
今後の研究の推進方策 |
コロナ過によりワークショップが難しいことも踏まえ、オンラインでの検証を試みる。
|