研究課題/領域番号 |
22K12050
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60090:高性能計算関連
|
研究機関 | 八戸工業大学 |
研究代表者 |
島内 宏和 八戸工業大学, 工学部, 准教授 (90759200)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
|
キーワード | 擬等角拡張 / 機械学習 / 敵対的生成ネットワーク / 外れ値検出 / 次元拡張 / 教師あり学習 |
研究開始時の研究の概要 |
本研究の目的は、データの特徴空間の等角自然な拡張に基づく、高精度な教師あり外れ値検出手法を構築することである。教師あり外れ値検出器の構築においては、外れ値の教師データが少なく、含まれる特徴の数も限られている場合が稀ではない。本研究では、擬等角拡張によりデータの特徴を高次元空間内に等角自然かつ一意的に拡張して豊かな表現を獲得し、敵対的生成ネットワークにより特徴空間が拡張されたデータを量的にも拡張することで、高精度な教師あり外れ値検出手法の実現を目指す。
|
研究実績の概要 |
本年度は、擬等角拡張を用いてデータセットの特徴空間を拡張する方式について検討した。はじめに、擬等角拡張としてBeurling-Ahlfors拡張を用いる手法を検討した。各特徴にスケーリングを施した上で、特徴の分布と一様な分布の対応関係から導かれる実軸の区分線形自己同相写像を構築した。Beurling-Ahlfors拡張の計算アルゴリズムを数値積分法を用いて実装し、構築した実軸の自己同相写像に対して適用することで、上半平面の自己同相写像へと拡張した。上半平面から基準となる点を選び、拡張により得られた上半平面の自己同相写像を適用し、それにより特徴空間を拡張した。構築した特徴空間拡張方式の効果を確認するため、データ数および特徴数が比較的少ない複数のデータセットを選定し、数値実験を行った。採用したデータセットをそのまま用いた場合と、構築した手法により特徴空間を拡張した場合の両者で、深層ニューラルネットワーク・アンサンブル法・サポートベクトルマシンの各機械学習手法により識別器を構築し、その性能を比較した。実験の結果、構築した手法により特徴空間拡張を行った場合に、いずれの機械学習法を用いた場合にも性能が向上することがあることを複数のデータセットにおいて確認した。今回構築した特徴空間拡張手法は、データの分布と擬等角拡張に基づく教師なし学習の範疇に入ることに注意されたい。 擬等角拡張として、Douady-Earle拡張を用いた場合の手法についても検討を進めている。データの分布から単位円周の自己同相写像を構成し、Abikoff-YeおよびCantarella-SchumacherによるDouady-Earle拡張の計算アルゴリズムにより単位円板の自己同相写像へと拡張し、単位円板内の基準点の像をサンプリングする形で特徴空間を拡張する方式を構築した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
「研究実績の概要」欄に記載の通り、Beurling-Ahlfors拡張を用いたデータセットの特徴空間の拡張により、データセット上で複数の機械学習手法により構築した識別器の性能が向上する場合があることを確認した段階である。なお、数値実験の際には複数の独立試行を行う形でその頑健性についても検証しており、良好な結果が得られている。また、Douady-Earle拡張を用いた場合の検証も進めている。構築した特徴空間の拡張手法に関し、擬等角拡張に用いる実軸および単位円周の自己同相写像の構成の際、データの分布と一様な分布との対応関係を用いた区分線形な自己同相写像を用いている。また、擬等角拡張後に特徴空間の拡張を行う際に、境界から一定の距離にある点の拡張後の写像による像をサンプリングしている。この区分線形写像の構成方法と特徴空間拡張時の像のサンプリング方式には変更の余地があり、一種のハイパーパラメータとも見なせるため、その調整法について検討したい。また、現在構築した特徴空間拡張手法においては、Beurling-Ahlfors拡張では数値積分法を、Douady-Earle拡張ではAbikoff-YeおよびCantarella-Schumacherによる先行研究で構築された数値的構成アルゴリズムを応用して実装し、スケーリングの上で各特徴に対して適用している。各特徴単位ではなく、より高い次元の空間における擬等角拡張を応用することも考えうるため、今後検討したい。なお、Beurling-Ahlfors拡張による特徴空間の拡張を用いた実験において、性能向上が見られないケースも存在した。この拡張がどのような場合に有効であるか分析を進めつつ、外れ値検出への応用を目指し、教師なし表現学習による外れ値検出の手法との融合を進めたい。
|
今後の研究の推進方策 |
はじめに、「研究実績の概要」に記したDouady-Earle拡張を用いた場合の特徴空間の拡張方式について、その効果を確認するための数値実験を進める。Beurling-Ahlfors拡張の場合と同様に、特徴空間の次元が低くデータの量が比較的少ない複数のデータセットを用いて、特徴空間の拡張前後において深層ニューラルネットワーク、アンサンブル法、サポートベクトルマシンにより識別器を構築し、その性能の変化について観察するとともに、複数回の独立試行により結果の頑健性も確認する。 その後、構築したBeurling-Ahlfors拡張およびDouady-Earle拡張を用いた特徴空間の拡張手法と、これまでに研究が進められている既存の外れ値検出のための教師なし表現学習の手法とを融合し、外れ値検出に有用な特徴表現を獲得する手法の構築を進める。具体的には、「現在までの進捗状況」に記載の構築した擬等角拡張による特徴空間拡張手法のハイパーパラメータの調整を行いつつ、既存の外れ値検出のための教師なし表現学習による特徴空間の拡張手法を擬等角拡張の事前または事後に組み込む形でアルゴリズムを構築し、数値実験を行う。実験については、複数の外れ値検出のためのベンチマークデータセットを選定し、特徴空間の拡張を行わない場合と、それぞれの拡張手法を単一で用いる場合、拡張手法を組み合わせた場合において、複数の機械学習の手法により識別器を構築し、その性能の変化を観察する。特徴空間の拡張手法を定めた後は、さらなる外れ値検出の性能向上に向け敵対的生成ネットワークとの融合に着手する。また、並行して高次元空間における擬等角拡張を用いた特徴空間の拡張方式についても、その数値計算法を含め検討を進める。
|