研究実績の概要 |
近年、グラフ構造に対して、グラフ内のノードやエッジ、部分グラフ、もしくはグラフ全体の特性を、機械学習で学習する研究が盛んに行われている。特にグラフニューラルネットワーク (Graph Neural Network)GNNは、ニューラルネットワークを用いて自動的にグラフ構造を学習し、教師付き機械学習、クラスタリングや異常検知などの教師なし学習に繋げる手法として、最も注目を浴びている領域である。 一方、「不均衡データ学習」とは、予測すべきラベルの分布が著しく不均衡であるデータセットに対する機械学習である。不均衡データ学習の特徴として、不正などを示すラベルが全データの中で極端に少なく、従来の機械学習およびGNNでは十分な精度と実行性能が得られない。代表的なアプリケーションとして、金融決済データにおける不正パターンの検出が挙げられる。人間が不正ラベルと判定したものを用いることで、教師付き機械学習により不正などノードやエッジの特性を判定する。しかし、不正取引は全体の中でもごく少数であり、高い精度で検出するのは困難である。上記の背景を踏まえた上で、本研究では「 不均衡データ学習に対する新たなGNNのアーキテクチャはどうあるべきか?」という学術的な「問い」に対して取り組んでいる。本年度は、「暗号通貨の金融取引における不正検知問題」をその問いを解くための題材として取り組み、ヘテロジニアスなグラフニューラルネットワークを用いて高精度な不正検知手法を提案、以下の論文を公開した。
Hiroki Kanezashi, Toyotaro Suzumura, Xin Liu, Takahiro Hirofuchi: Ethereum Fraud Detection with Heterogeneous Graph Neural Networks. CoRR abs/2203.12363 (2022)
|