2021 Fiscal Year Annual Research Report
長期的な因果関係に基づく類似出来事の検出に関する研究
Project/Area Number |
19K20631
|
Research Institution | Takushoku University |
Principal Investigator |
澄川 靖信 拓殖大学, 工学部, 助教 (70756303)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 因果関係 / 最大重みマッチング問題 / 二部グラフ / Wikipedia / Twitter |
Outline of Annual Research Achievements |
2021年度に取り組んだ内容は、因果関係どうしの類似度を評価するアルゴリズムの設計と、因果関係を構成するためのデータセットの整備の2つある。1つ目のアルゴリズム設計に関しては昨年度の研究成果を発展させ、アルゴリズムを実装・評価を行い、その成果をまとめた論文を国際会議で発表した。この評価の際に、より広範囲なデータでも扱えるようにする重要性が明らかになったので、2つ目の成果であるデータセットの整備に取り組んだ。これらの成果の詳細は次の通りである。 本アルゴリズムは、複数の出来事をまとめて構成する因果関係同士の類似度を評価することが目的である。このために、まず、類似度を評価する2つの因果関係から二部グラフを構築する。この二部グラフでは、各出来事同士の類似度を辺の重みとする。本アルゴリズムは、この二部グラフ上で「解を構成する辺集合が交点を持たない」という制約を与えた最大重みマッチング問題を解く。この問題のソルバーとして、動的計画法によるアルゴリズムの設計した。本手法の有効性を評価するために、多くの因果関係を含むW2Eデータセットを用いた。比較対象よりも本手法の方が高い精度を得られることを確認した。この成果は国際会議WI-IAT2021のフルペーパーとして採択された。 上記の国際会議論文は、Wikipediaに収録されたニュースを用いて因果関係を構築している。現代では、Twitterでもニュースが報道されているので、本研究では、過去の出来事を参照しているツイートを収集し、ツイート本文で構築した因果関係を定義するための基礎を用意した。このようなツイートを収集するために、Twitter社が提供しているAPIを用いてデータを収集し、出来事を表すハッシュタグのカテゴリ名を用いた。収集したデータの学術的新規性をまとめた論文が国際論文誌Data in Briefに採択された。
|
Research Products
(3 results)