2022 Fiscal Year Research-status Report
Integration of indices for multicollinearity detection
Project/Area Number |
21K04527
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
宮代 隆平 東京農工大学, 工学(系)研究科(研究院), 准教授 (50376860)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | OR |
Outline of Annual Research Achievements |
本研究は,データサイエンスおよび統計学における回帰分析に着目し,特徴選択(変数選択)の精度を高めることを目的としている.研究当初の計画では,特徴選択の際に問題点となりうる「多重共線性」に着目し,また多重共線性の新たな判定指標を発見することを目的としていた. しかしながら研究を進めていくうちに,非凸非線形な目的関数を持つ特徴選択問題に対する新しいアルゴリズムの構築を目指す方向性に研究方針を転換することとした.これは,多重共線性を含むか否かに関わらず,種々の特徴選択問題全般に適用できる数理モデル化(定式化)の開発に目途がたったためである. 令和4年度の研究においては,令和3年度に開発した正準相関分析における特徴選択における特徴選択アルゴリズムの改良を行った.また,サポートベクターマシンを利用した特徴選択問題では,DBTCと呼ばれる高次元空間におけるクラス間の重心間距離が用いられるが,このDBTCの最大化問題についても取り組んだ.DBTCの最大化問題は,指数関数を含む非凸非凹離散最適化問題であり,従来は最適化が非常に困難であったという現状がある.この問題点について,令和4年度の研究では線形整数最適化としてのモデル化に成功した.この問題に対し線形整数最適化としてのモデル化(定式化)は世界で初の結果であり,また類似の特徴選択問題にも応用できるモデル化であることから,重要な成果と判断している.同じくDBTCの最大化問題に対し,提案したモデルを用いて多数のデータに対する計算機実験を遂行した.また,研究の成果をまとめ英文論文誌への投稿も行った.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究では当初,特徴選択の際に問題点となりうる「多重共線性」に着目し,多重共線性を避けた特徴選択アルゴリズムの開発,および多重共線性を判定する新たな指標の開発を目的としていた.しかしながら研究を進めていくうちに,多重共線性を含む/含まないにかかわらない,複数の非凸非線形な目的関数を持つ特徴選択問題に対するアルゴリズムの構築に目途がたったため,研究方針を転換することとした.そのため,当初の計画より若干進捗が遅れていると判断している.
|
Strategy for Future Research Activity |
令和5年度の研究においては,令和4年度に行ったDBTCを最大化する特徴選択アルゴリズムについて,引き続き研究を行う予定である.令和4年度に開発した特徴選択アルゴリズムは厳密解法であり,計算が終了した段階では真の最適解が得られるのが特徴であるが,一方で計算時間が長くかかるという問題点も存在している.この点をふまえ,令和5年度ではヒューリスティック解法の開発を行う.具体的には,DBTCの最大化においては,令和4年度に開発した数理モデル化を使う前提の下では分枝限定法内部の緩和問題が高速に解けることを生かし,本問題専用の分枝限定法を自前で実装することにより,従来のソルバー利用を前提とした解法より高速なアルゴリズムの開発が行えるのではないかと予想している. また,同じくヒューリスティクス解法として,先行研究ではDC最適化を利用するアルゴリズムが提案されている.このアルゴリズムでは,精度が非常に良くなるインスタンスとそうでないインスタンスが存在しており,この差異の原因がわかれば本研究で提案予定のアルゴリズムのさらなる改良に繋げられると考えられるため,この点についても詳細な調査を行う予定である.
|
Causes of Carryover |
研究計画の変更により研究の進捗に多少の遅れが出ており,予定していた論文掲載料の支払いが令和4年度に発生しなかったため,次年度使用額が多少発生している.次年度使用額については,令和5年度に論文掲載料が発生する予定であることと,研究計画の変更により新たに実験用計算機を追加で購入して計算機実験をより効率的に行う予定であるため,次年度使用額を含めた予算を過不足なく使用できる想定である.
|