2022 Fiscal Year Research-status Report
Constructing Highly Accurate Supervised Outlier Detection Method by Quasiconformal Extension and Generative Adversarial Networks
Project/Area Number |
22K12050
|
Research Institution | Hachinohe Institute of Technology |
Principal Investigator |
島内 宏和 八戸工業大学, 工学部, 准教授 (90759200)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 擬等角拡張 / 機械学習 / 敵対的生成ネットワーク / 外れ値検出 |
Outline of Annual Research Achievements |
本年度は、擬等角拡張を用いてデータセットの特徴空間を拡張する方式について検討した。はじめに、擬等角拡張としてBeurling-Ahlfors拡張を用いる手法を検討した。各特徴にスケーリングを施した上で、特徴の分布と一様な分布の対応関係から導かれる実軸の区分線形自己同相写像を構築した。Beurling-Ahlfors拡張の計算アルゴリズムを数値積分法を用いて実装し、構築した実軸の自己同相写像に対して適用することで、上半平面の自己同相写像へと拡張した。上半平面から基準となる点を選び、拡張により得られた上半平面の自己同相写像を適用し、それにより特徴空間を拡張した。構築した特徴空間拡張方式の効果を確認するため、データ数および特徴数が比較的少ない複数のデータセットを選定し、数値実験を行った。採用したデータセットをそのまま用いた場合と、構築した手法により特徴空間を拡張した場合の両者で、深層ニューラルネットワーク・アンサンブル法・サポートベクトルマシンの各機械学習手法により識別器を構築し、その性能を比較した。実験の結果、構築した手法により特徴空間拡張を行った場合に、いずれの機械学習法を用いた場合にも性能が向上することがあることを複数のデータセットにおいて確認した。今回構築した特徴空間拡張手法は、データの分布と擬等角拡張に基づく教師なし学習の範疇に入ることに注意されたい。 擬等角拡張として、Douady-Earle拡張を用いた場合の手法についても検討を進めている。データの分布から単位円周の自己同相写像を構成し、Abikoff-YeおよびCantarella-SchumacherによるDouady-Earle拡張の計算アルゴリズムにより単位円板の自己同相写像へと拡張し、単位円板内の基準点の像をサンプリングする形で特徴空間を拡張する方式を構築した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
「研究実績の概要」欄に記載の通り、Beurling-Ahlfors拡張を用いたデータセットの特徴空間の拡張により、データセット上で複数の機械学習手法により構築した識別器の性能が向上する場合があることを確認した段階である。なお、数値実験の際には複数の独立試行を行う形でその頑健性についても検証しており、良好な結果が得られている。また、Douady-Earle拡張を用いた場合の検証も進めている。構築した特徴空間の拡張手法に関し、擬等角拡張に用いる実軸および単位円周の自己同相写像の構成の際、データの分布と一様な分布との対応関係を用いた区分線形な自己同相写像を用いている。また、擬等角拡張後に特徴空間の拡張を行う際に、境界から一定の距離にある点の拡張後の写像による像をサンプリングしている。この区分線形写像の構成方法と特徴空間拡張時の像のサンプリング方式には変更の余地があり、一種のハイパーパラメータとも見なせるため、その調整法について検討したい。また、現在構築した特徴空間拡張手法においては、Beurling-Ahlfors拡張では数値積分法を、Douady-Earle拡張ではAbikoff-YeおよびCantarella-Schumacherによる先行研究で構築された数値的構成アルゴリズムを応用して実装し、スケーリングの上で各特徴に対して適用している。各特徴単位ではなく、より高い次元の空間における擬等角拡張を応用することも考えうるため、今後検討したい。なお、Beurling-Ahlfors拡張による特徴空間の拡張を用いた実験において、性能向上が見られないケースも存在した。この拡張がどのような場合に有効であるか分析を進めつつ、外れ値検出への応用を目指し、教師なし表現学習による外れ値検出の手法との融合を進めたい。
|
Strategy for Future Research Activity |
はじめに、「研究実績の概要」に記したDouady-Earle拡張を用いた場合の特徴空間の拡張方式について、その効果を確認するための数値実験を進める。Beurling-Ahlfors拡張の場合と同様に、特徴空間の次元が低くデータの量が比較的少ない複数のデータセットを用いて、特徴空間の拡張前後において深層ニューラルネットワーク、アンサンブル法、サポートベクトルマシンにより識別器を構築し、その性能の変化について観察するとともに、複数回の独立試行により結果の頑健性も確認する。 その後、構築したBeurling-Ahlfors拡張およびDouady-Earle拡張を用いた特徴空間の拡張手法と、これまでに研究が進められている既存の外れ値検出のための教師なし表現学習の手法とを融合し、外れ値検出に有用な特徴表現を獲得する手法の構築を進める。具体的には、「現在までの進捗状況」に記載の構築した擬等角拡張による特徴空間拡張手法のハイパーパラメータの調整を行いつつ、既存の外れ値検出のための教師なし表現学習による特徴空間の拡張手法を擬等角拡張の事前または事後に組み込む形でアルゴリズムを構築し、数値実験を行う。実験については、複数の外れ値検出のためのベンチマークデータセットを選定し、特徴空間の拡張を行わない場合と、それぞれの拡張手法を単一で用いる場合、拡張手法を組み合わせた場合において、複数の機械学習の手法により識別器を構築し、その性能の変化を観察する。特徴空間の拡張手法を定めた後は、さらなる外れ値検出の性能向上に向け敵対的生成ネットワークとの融合に着手する。また、並行して高次元空間における擬等角拡張を用いた特徴空間の拡張方式についても、その数値計算法を含め検討を進める。
|