• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多重共線性の評価指標統一に向けた最良特徴選択手法の構築と回帰モデルの統計的解析

研究課題

研究課題/領域番号 21K04527
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分25010:社会システム工学関連
研究機関東京農工大学

研究代表者

宮代 隆平  東京農工大学, 工学(系)研究科(研究院), 准教授 (50376860)

研究期間 (年度) 2021-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワードOR / 統計学 / 特徴選択 / 変数選択 / 整数最適化 / 統計 / アルゴリズム / 多重共線性
研究開始時の研究の概要

多重共線性とは、回帰分析において特徴選択により得られた回帰モデルに線形従属性が高い特徴が含まれることであり、予測精度が悪化するため避けるべき現象である。これまで多重共線性の大きさを評価する指標は「相関係数行列の条件数」と「分散拡大要因」が独立に用いられていたが、最近の研究により前者の指標では多重共線性が大きいと判定されるが後者の指標ではそうならない回帰モデルや逆の状態を示す回帰モデルの存在が判明するなど、指標間の整合性の欠如が明らかになってきた。本研究では、両者の指標を考慮した最良特徴選択の手法を構築して多数の回帰モデルの統計的解析を行うことにより、多重共線性の評価指標の統一を目指す。

研究成果の概要

研究期間に得られた成果として,まず正準相関分析における特徴選択について,整数最適化を用いた特徴選択アルゴリズムを構築した.構築したアルゴリズムは,非凸非線形な整数最適化問題の求解を含み,汎用の最適化ソルバーでは解くのが困難な問題である.この整数最適化問題に対して新しく分枝限定法を実装し,既存のソルバーより100倍程度高速に計算が可能になったことを確認した.また,サポートベクターマシンなどに現れる高次元空間におけるクラス間の重心間距離最大化問題は,指数関数を含む非凸非凹離散最適化問題であり最適化が非常に困難であったが,この問題に対し線形整数最適化としての定式化を構築することに成功した.

研究成果の学術的意義や社会的意義

現象を観察して得られたデータから重回帰分析で回帰モデルを作成する際に、無関係な特徴を削除して必要な特徴だけを回帰モデルに組み入れることを特徴選択と呼ぶ。特徴選択は変数選択とも言われ、古くから統計学における課題であったが、近年のデータサイエンスの流行に伴い改めて重要性が指摘されている。本研究では、特徴選択における二つの重要な問題(正準相関分析における特徴選択問題、高次元空間におけるクラス間の重心間距離最大化問題)に対して、新しい数理モデル化を提案した。これらの問題はその非線形性から、従来のソフトウェアでは解くのが困難だったが、本研究の提案手法により高速に最適な特徴選択が行えるようになった。

報告書

(4件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 研究成果

    (5件)

すべて 2024 2023 2022 2021

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件)

  • [雑誌論文] Mixed-Integer Linear Optimization Formulations for Feature Subset Selection in Kernel SVM Classification2024

    • 著者名/発表者名
      TAMURA Ryuta、TAKANO Yuichi、MIYASHIRO Ryuhei
    • 雑誌名

      IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences

      巻: E107.A 号: 8 ページ: 1151-1162

    • DOI

      10.1587/transfun.2023EAP1043

    • ISSN
      0916-8508, 1745-1337
    • 年月日
      2024-08-01
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Branch-and-bound algorithm for optimal sparse canonical correlation analysis2023

    • 著者名/発表者名
      A. Watanabe, R. Tamura, Y. Takano, R. Miyashiro
    • 雑誌名

      Expert Systems with Applications

      巻: 217 ページ: 119530-119530

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり
  • [学会発表] 混合整数最適化によるカーネルSVMの変数選択2023

    • 著者名/発表者名
      田村隆太,高野祐一,宮代隆平
    • 学会等名
      日本オペレーションズ・リサーチ学会2023年春季研究発表会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 混合整数最適化によるカーネルSVMの変数選択2022

    • 著者名/発表者名
      田村隆太,高野祐一,宮代隆平
    • 学会等名
      数理最適化:モデル,理論,アルゴリズム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Branch-and-bound algorithm for optimal sparse canonical correlation analysis2021

    • 著者名/発表者名
      Y. Takano, A. Watanabe, Ryuta Tamura, R. Miyashiro
    • 学会等名
      INFORMS Annual Meeting 2021
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会

URL: 

公開日: 2021-04-28   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi