研究課題/領域番号 |
21K04527
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分25010:社会システム工学関連
|
研究機関 | 東京農工大学 |
研究代表者 |
宮代 隆平 東京農工大学, 工学(系)研究科(研究院), 准教授 (50376860)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | OR / 統計学 / 特徴選択 / 変数選択 / 整数最適化 / 統計 / アルゴリズム / 多重共線性 |
研究開始時の研究の概要 |
多重共線性とは、回帰分析において特徴選択により得られた回帰モデルに線形従属性が高い特徴が含まれることであり、予測精度が悪化するため避けるべき現象である。これまで多重共線性の大きさを評価する指標は「相関係数行列の条件数」と「分散拡大要因」が独立に用いられていたが、最近の研究により前者の指標では多重共線性が大きいと判定されるが後者の指標ではそうならない回帰モデルや逆の状態を示す回帰モデルの存在が判明するなど、指標間の整合性の欠如が明らかになってきた。本研究では、両者の指標を考慮した最良特徴選択の手法を構築して多数の回帰モデルの統計的解析を行うことにより、多重共線性の評価指標の統一を目指す。
|
研究成果の概要 |
研究期間に得られた成果として,まず正準相関分析における特徴選択について,整数最適化を用いた特徴選択アルゴリズムを構築した.構築したアルゴリズムは,非凸非線形な整数最適化問題の求解を含み,汎用の最適化ソルバーでは解くのが困難な問題である.この整数最適化問題に対して新しく分枝限定法を実装し,既存のソルバーより100倍程度高速に計算が可能になったことを確認した.また,サポートベクターマシンなどに現れる高次元空間におけるクラス間の重心間距離最大化問題は,指数関数を含む非凸非凹離散最適化問題であり最適化が非常に困難であったが,この問題に対し線形整数最適化としての定式化を構築することに成功した.
|
研究成果の学術的意義や社会的意義 |
現象を観察して得られたデータから重回帰分析で回帰モデルを作成する際に、無関係な特徴を削除して必要な特徴だけを回帰モデルに組み入れることを特徴選択と呼ぶ。特徴選択は変数選択とも言われ、古くから統計学における課題であったが、近年のデータサイエンスの流行に伴い改めて重要性が指摘されている。本研究では、特徴選択における二つの重要な問題(正準相関分析における特徴選択問題、高次元空間におけるクラス間の重心間距離最大化問題)に対して、新しい数理モデル化を提案した。これらの問題はその非線形性から、従来のソフトウェアでは解くのが困難だったが、本研究の提案手法により高速に最適な特徴選択が行えるようになった。
|