2021 Fiscal Year Research-status Report
Integration of indices for multicollinearity detection
Project/Area Number |
21K04527
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
宮代 隆平 東京農工大学, 工学(系)研究科(研究院), 准教授 (50376860)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | OR / 統計 / 特徴選択 / アルゴリズム / 多重共線性 |
Outline of Annual Research Achievements |
本研究は,データサイエンスおよび統計学の中の回帰分析に着目し,特徴選択の精度を高めることを目的としている.特に,特徴選択の際の多重共線性に注目し,これまで検出できなかった多重共線性の特徴を解析し,より良い回帰分析および特徴選択のアルゴリズムを構築することを研究目標の中心に位置づけていた. 当該年度では,回帰分析の一種類である正準相関分析における特徴選択について,本研究課題の特徴でもある整数最適化を用いた特徴選択アルゴリズムを構築し,学術論文誌への投稿を行った.構築した特徴選択アルゴリズムは,整数最適化の観点からは非凸非線形な整数最適化問題となり,一般の最適化ソルバーでは解くのが非常に困難な問題になる.この整数最適化問題に対して,新しく分枝限定法を実装し,既存のソフトウェアより100倍程度高速に計算が可能になったことを確認した. また,クラスター分析と組み合わせて用いられる種類の特徴選択問題に関して,やはり従来手法では非凸非線形な整数最適化問題として扱われていたが,同様の手法で凸な整数計画問題として定式化可能なのではないかという発想に至り,現在解析を進めている段階である. これらの研究成果から,当初計画では多重共線性に注目した特徴選択アルゴリズムを構築することを目的としていたが,目的をより一般的に拡張し,(緩和問題が)非凸非線形な目的関数となる特徴選択問題に対するアルゴリズムの構築を新たな研究目的とするかどうか,現在検討中である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では,当初は回帰分析における多重共線性に注目し,多重共線性の影響を排除できる特徴選択のアルゴリズムを構築することを目的としていた.しかし,研究を進めていくうちに,非凸非線形な目的関数を持つような特徴選択問題に対する新しいアルゴリズムの構築に目途が立ちつつあり,研究目的をより一般的に拡張して研究を遂行することを現在検討している.既に正準相関分析における特徴選択問題に対しては,従来手法より大幅に高速なアルゴリズムを開発して論文投稿を済ませており,現在ではクラスター分析で用いられる種類の特徴選択問題についてもアルゴリズムの開発が上手く行きそうなことから,研究の当初目的とは多少方向性が異なるが,研究はおおむね順調に進展していると判断する.
|
Strategy for Future Research Activity |
今後の研究方針としては,現在行っているクラスター分析で用いられる種類の特徴選択問題に対するアルゴリズムの開発を引き続き進める.また,扱っている特徴選択問題および正準相関分析において現れた整数最適化問題は,両方とも(緩和問題も)非凸非線形な問題であり,アルゴリズムの構築で得られた知見が他の特徴選択問題に応用できる可能性が高い.そのため,当初の研究目的であった多重共線性およびその評価指標の開発には必ずしもとらわれず,特徴選択問題一般に関してより効率的なアルゴリズムの開発を行うことを次年度の目的とする予定である.これには,新しい定式化を導出することで計算の高速化を目指す方向性と,分枝限定法を新たに実装する両方の方針が考えられ,今後どちらが効率的か検討を進める必要がある.
|
Causes of Carryover |
コロナ禍のために国際会議への出席を取りやめたため,予算に若干の残額が発生したが,次年度使用額は少額のため当初計画通りで問題無く使用できると考えている.
|