クラスタリングはデータの構造や固有の特徴を発見する手法として知られている。本研究では、大規模データに潜む因果関係や相互作用の解明を目的として、ネットワークデータのクラスタリング(ネットワーククラスタリング)を中核とするクラスタリング技法の高度化に取り組んだ。令和3年度は当初の研究計画に従い、これまでに開発したクラスタリング技法の再開発および実用化に向けた知識ベースの高度化を進めた。はじめに、クラスタ内の個体数に関する制約条件を組み込んだサイズコントロール付きネットワーククラスタリングの評価および特徴把握に取り組んだ。ネットワークデータに対する複数のクラスタリング手法と開発手法によるクラスタ分割の類似性を多次元尺度構成法により可視化することで、開発手法の分類特徴が既存手法と異なる点、類似する結果が得られるパラメータについて考察した。ここで得られた結果をまとめ、国際会議MDAI2021にてオンラインで口頭発表を行った。また、投稿論文はLNAI12898に掲載されている。次に、ネットワーククラスタリングに関する研究で得られた知見を基に、時間変化する構造を持つ時系列データに対するクラスタリング技法の開発に取り組んだ。ここでは、時系列データに対する新たなクラスタリング手法の開発およびクラスタリングに基づく異常検知についても取り組んだ。前者は、知能と情報(日本知能情報ファジィ学会論文誌、査読付き)に掲載され、後者は国内研究会で2件の口頭発表を行った。さらに、サイズコントロールの発想をネットワークデータのエッジに拡張したエッジサイズに関する数理モデルを構築し、新たなクラスタリング手法を提案し、国内研究会で1件の口頭発表を行った。本研究項目はアルゴリズムの開発に留まったため、現在も引き続き検討を進めている。
|