非線形回帰近似推定による特徴量選択手法の収束速度と安定性向上に関する研究

Research Project

Project/Area Number	23K16937
Research Category	Grant-in-Aid for Early-Career Scientists
Allocation Type	Multi-year Fund
Review Section	Basic Section 61030:Intelligent informatics-related
Research Institution	Iwate University
Principal Investigator	游梦博岩手大学, 理工学部, 助教 (00972316)
Project Period (FY)	2023-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000) Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000) Fiscal Year 2023: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Keywords	特徴量選択 / 擬似ラベル / グローバル類似性 / 親和性行列 / 特徴量選択手法
Outline of Research at the Start	膨大な量のデータから冗長性を削減し，最も重要な特徴量を選択する技術の重要性が高まっている．これらの特徴量選択技術を開発するために特徴と擬似ラベルの相関関係を掘り下げることが必要不可欠である．申請者はこれまで適応型グラフを考慮した特徴量選択最適化モデルを構築し，反復アルゴリズムの収束性について研究してきた．しかし，これまでの研究では線形回帰を用いて擬似ラベルを求める仮定に留まっており，非線形の近似推定により最適化することには至っていない．本研究では，特徴空間から擬似ラベル空間への変換を非線形回帰により学習させることで，特徴量選択アルゴリズムの収束速度と安定性を向上させることが目的である．
Outline of Annual Research Achievements	令和5年度において，研究目的の一つである「特徴量選択アルゴリズムの安定性向上」を実現するため，複数の最適化技術の開発を進めた．まず，(1)非線形回帰を導入した特徴量選択アルゴリズムを設計・提案した．従来の特徴量選択手法では，特徴を表す行列データと擬似ラベルの間に線形関係が存在していると仮定し，線形回帰を用いて擬似ラベルを学習していたが，高次元データの量の増加に伴い，データの構造関係もより複雑になることがわかった．そのため，データのさまざまな特徴と擬似ラベル間の変換関係を正確に推定するためには，線形仮定では不十分であることを検証した．ニューラルネットワークを用いて実現した非線形回帰の近似推定を目的関数に導入し，近似推定の結果と擬似ラベルとの誤差を最小化する際に最適解を求めることが可能になった．(2)特徴同士の類似性評価方法を改善するため，類似性を記録するグローバル親和性行列の再構築手法を提案した．すべてのデータ特徴をランダムに分割してグループ化を行い，グループ内部の特徴同士がローカル類似性を表す一方で，グループ間の関連性を評価することで，ローカル類似性を微調整したグローバル類似性をより効率的に最適化するプロセスを構築した．(3)非線形回帰の近似推定に対して目的関数内の4つの未知変数行列を個別に最適化するための反復的な計算式を導出し，ベンチマークとなる８つのデータセットにおいてクラスタリング精度と予測ラベルの正規化相互情報量のふたつの指標で安定性を定量的に評価した．グローバル親和性行列の再構築手法に対して3つのハイパースペクトル画像データセットにおける特徴量選択アルゴリズムの安定性を検証した．
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 特徴量選択の安定性向上を目指し，新たな目的関数の設計と提案が順調に進んだ．ベンチマークとなるデータセットで，クラスタリング精度と予測ラベルの正規化相互情報量の2つの指標で安定性を定量的に評価し，既存手法を上回ることを検証した．さらに，特徴同士の類似性評価方法を改善するために，類似性を記録するグローバル親和性行列の再構築手法を提案し，3つのハイパースペクトル画像データセットにおける特徴量選択アルゴリズムの安定性評価を進めた．提案手法は，機械学習におけるデータの前処理として実装された．これらの研究成果は，複数の国際会議ワークショップおよび学術論文誌で発表された．また，最終的な研究目的である安定性と収束性のバランスを考慮した特徴量選択手法の設計も進め，既存手法と比較できるようにアルゴリズムの計算複雑度と収束するまでの計算量評価が完了している．
Strategy for Future Research Activity	これまでの特徴量選択の目的関数には，非線形回帰を導入したため，2つの最適化問題に分割する必要がある．具体的には，非線形回帰の近似推定を最適化した後，残りの3つの未知変数行列を個別に最適解を求める必要がある．これにより，アルゴリズムの設計段階でネストループ処理が不可欠であり，計算量が増加し，収束速度が既存手法よりも遅くなる結果が得られた．次元数が非常に多いデータセットに応用する際に，最適なハイパーパラメータを見つけるのが困難である．これに対して，安定性と収束性のバランスを考慮した特徴量選択手法が検討・設計中である．提案として，元データの次元数を複数のグループに分割し，グループごとに擬似ラベルの近似推定を求めた後，各グループの最適化結果を組み合わせることで，より早い速度で高次元データセットの特徴量選択を実現することが可能である．また，これまでの特徴量選択手法の応用できるデータセットは行列に整えるデータセットに限られている．点群などの順序のないデータに応用するために，深層学習技術を用いて中間段階の特徴を抽出し，整列したデータとして特徴量選択を適用することができる．これらの提案については，複数のデータセットで検証実験を行い，検証結果に基づいて手法の設計・調整を試行錯誤し開発を進める．最終的には，安定性と収束性のバランスを考慮した特徴量選択手法に関する研究成果を国際会議や国際ジャーナルに投稿する予定である．

Report

(1 results)

2023 Research-status Report

Research Products
(3 results)

All 2023

All Journal Article (1 results) (of which Int'l Joint Research: 1 results, Peer Reviewed: 1 results, Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 2 results)

[Journal Article] Robust Unsupervised Hyperspectral Band Selection via Global Affinity Matrix Reconstruction2023
- Author(s)
  You Mengbo、Yuan Aihong、Zou Min、Konno Kouichi
- Journal Title
  
  IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing
  
  Volume: 16 Pages: 7374-7384
- DOI
  10.1109/jstars.2023.3299731
- Related Report
  2023 Research-status Report
- Peer Reviewed / Open Access / Int'l Joint Research
[Presentation] A Study on Predicting the Distribution of Iwasesenzuka-Kofun with CNN2023
- Author(s)
  Mengbo You, Kouichi Konno, Atsushi Noguchi, Ryosuke Nakamura, Yuichi Takata
- Organizer
  15th International Conference On Frontiers Of Information Technology, Applications And Tools(FITAT2023)
- Related Report
  2023 Research-status Report
- Int'l Joint Research
[Presentation] Matching up Stone Tools and Storage Bag using Image Identification with CNN2023
- Author(s)
  Mengbo You, Kouichi Konno
- Organizer
  NICOGRAPH International 2023
- Related Report
  2023 Research-status Report
- Int'l Joint Research

非線形回帰近似推定による特徴量選択手法の収束速度と安定性向上に関する研究

Principal Investigator

游 梦博 岩手大学, 理工学部, 助教 (00972316)

¥2,340,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥540,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Robust Unsupervised Hyperspectral Band Selection via Global Affinity Matrix Reconstruction2023

Author(s)

Journal Title

DOI

Related Report

[Presentation] A Study on Predicting the Distribution of Iwasesenzuka-Kofun with CNN2023

Author(s)

Organizer

Related Report

[Presentation] Matching up Stone Tools and Storage Bag using Image Identification with CNN2023

Author(s)

Organizer

Related Report

游梦博岩手大学, 理工学部, 助教 (00972316)