Project/Area Number |
22K12050
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60090:High performance computing-related
|
Research Institution | Hachinohe Institute of Technology |
Principal Investigator |
島内 宏和 八戸工業大学, 工学部, 准教授 (90759200)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2022: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
|
Keywords | 擬等角拡張 / Beurling-Ahlfors拡張 / 機械学習 / 教師なし表現学習 / 外れ値検出 / 敵対的生成ネットワーク / 次元拡張 / 教師あり学習 |
Outline of Research at the Start |
本研究の目的は、データの特徴空間の等角自然な拡張に基づく、高精度な教師あり外れ値検出手法を構築することである。教師あり外れ値検出器の構築においては、外れ値の教師データが少なく、含まれる特徴の数も限られている場合が稀ではない。本研究では、擬等角拡張によりデータの特徴を高次元空間内に等角自然かつ一意的に拡張して豊かな表現を獲得し、敵対的生成ネットワークにより特徴空間が拡張されたデータを量的にも拡張することで、高精度な教師あり外れ値検出手法の実現を目指す。
|
Outline of Annual Research Achievements |
本年度は、はじめに前年度に構築したBeurling-Ahlfors拡張を用いた教師なし表現学習による特徴空間の拡張方式について、識別のデータセット上での有効性を精査した。複数のデータセットを用いた実験において、データが識別に有用な一定以上のレベルの情報を含む場合、生成された特徴表現が複数の機械学習アルゴリズムによる識別器の性能向上に寄与することが確認された。この研究成果は論文としてまとめ、15th International Conference on Neural Computation Theory and Applications (Rome, Italy)に投稿し、受理された。口頭発表を行った結果、同会議におけるBest Paper Candiatesに選出され、拡張論文の投稿の招待を受けた。 発表後に、複数の回帰のデータセットに対して、識別の場合と同様の検証を実施した。実験の結果、データセットが該当のタスクに資する一定以上の情報を有している場合に、その性能が向上することが確認された。 教師あり外れ値検出のタスクへの応用にも取り組んだ。構築した手法により特徴空間を拡張し、その上での外れ値の分布を敵対的生成ネットワークにより学習し、新らたな外れ値に類するデータをサンプリングすることで、データの量的な拡張を行った。データセットの拡張前と拡張後において勾配ブースティングによる外れ値検出器を構築した結果、拡張によりその性能および頑健性の両者が向上することが確認された。これらの結果について論文にまとめ、現在投稿中である。 Douady-Earle拡張の応用についても着手しており、拡張の特性を考慮した単位円周の自己同相写像の構成について考察した。高次元の擬等角拡張を用いた特徴空間の拡張についても検討を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
前年度までに構築したBeurling-Ahlfors拡張を利用した特徴空間の拡張方式について、教師あり学習の識別および回帰のデータセットを用いた実験において、データが該当のタスクに関する一定以上の有用な情報を含む場合、複数の機械学習アルゴリズムによる識別および回帰モデルの性能向上に寄与することが確認された。また、複数の教師あり外れ値検出のデータセットにおいて、構築した手法によりデータセットの特徴空間を拡張した上で、その分布を敵対的生成ネットワークで学習した。新たな外れ値に類するデータを学習した分布からサンプリングすることで、データセットを量的にも拡張することを試みた。実験において、本方式によるデータセットの拡張により、勾配ブースティングを用いた外れ値検出器の性能が向上することが確認されている。構築した教師なし表現学習手法は特徴の分布の情報に基づくものであり、また外れ値検出以外の識別および回帰のデータセットにおいても性能の向上が確認されていることから、構築した手法と本質的に異なる外れ値検出のための表現学習手法との融合により、さらに高性能な外れ値検出が実現できる可能性がある。Aggarwalら、Micenkovaら、およびZhao-Hryniewickiによる教師なし外れ値検出アルゴリズムを用いた表現学習手法などが、構築した手法との融合の候補として考えられる。 高次元の擬等角拡張を用いた特徴空間の拡張方式については、拡張の対象となる区分線形写像の構成および外れ値検出に有効となりうる高次元の擬等角拡張の計算方法の検討を進めた。拡張前の区分線形写像について、特徴ベクトルの集合を用いて分布を反映した同相写像となるように構成する必要があり、その方法についての検討を進めた。
|
Strategy for Future Research Activity |
本年度は、前年度までに構築したBeurling-Ahlfors拡張を利用した特徴空間の拡張手法と、既存の外れ値の表現学習手法を融合することで、教師あり外れ値検出のさらなる高性能化を試みる。具体的には、Aggarwalら、Micenkovaら、およびZhao-Hryniewickiによる外れ値検出のための教師なし表現学習手法により拡張された特徴空間を、本研究において構築した手法でさらに拡張することで、外れ値検出のさらなる性能向上に資する特徴表現の獲得を目指す。手法の融合にあたっては、拡張の各段階において冗長な特徴が生成されうる。Beurling-Ahlfors拡張による拡張の段階では、特徴の分布が一様分布に近い場合、生成される特徴は元の特徴と似たものとなり、性能の向上には繋がらない。そのため、Benjamini-Hochberg procedureなどの統計的な手法等を援用し、拡張後に性能向上に寄与しないと思われる特徴を除外するなどの手続きを導入することについても検討したい。 Douady-Earle拡張を応用した特徴空間の拡張手法については、特徴の分布を反映した単位円周の自己同相写像の構成や、単位閉円板内へ拡張後の新らたな特徴のサンプリング方法などに自由度があるため、これらを中心に教師あり外れ値検出への応用に向けた検討を進める。 高次元の擬等角拡張を用いた特徴空間の拡張方式については、はじめに各特徴をスケーリングした上で、Delaunay三角形分割のアルゴリズム等を応用し、特徴の情報を反映した区分線形同相写像の構成を進める。その後、既存の高次元の擬等角拡張手法の数値的構成プログラムを実装し、構築した区分線形同相写像への適用して、外れ値検出のための特徴表現の獲得を試みる。
|