研究課題/領域番号 |
19K20224
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 帝京大学 |
研究代表者 |
小林 靖之 帝京大学, 理工学部, 准教授 (00604513)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2019年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
|
キーワード | スパースモデリング / 異常度に対するスパース化 / マハラノビス距離 / 数値計算上の安定条件 / 正則化係数 / 母固有値の値0 / 母固有値0の標本主成分 / 母固有値0の標本固有値 / 浮動小数点演算 / 数値誤差 |
研究開始時の研究の概要 |
機械学習で問題となる過学習防止や変数の意味づけ困難を解決するため、多くの変数をもつデータを少ない変数で表すスパースモデリングが注目を集めている。教師付き学習では大きな成果を挙げているが、半教師付き学習である未知異常サンプルを検出する目的の異常度に対するスパース化は学習サンプルだけに留まり、異常度自体はスパース化されていない。 本研究では、学習サンプルではなく異常度モデル自体をスパース化したモデルをマハラノビス距離に対して提案し、その数値計算上の安定条件の提案・証明や、スパース化に必要な正則化係数を数値実験無しで決定する手順を提案し、その妥当性を明らかにする。
|
研究成果の概要 |
スパース化した標本マハラノビス距離モデルとして、未知データxと学習データの標本共分散行列Sに基づく一次連立方程式をCoordinateDescent法で解いて得たStudent化主成分ベクトルを用いるモデルを提案した。 母固有値が0値の標本主成分と正値の母固有値の標本主成分との差異を明らかにする必要があるため、正値の母固有値の標本主成分について標本固有値・ベクトルのバラツキを考慮した標本Student化主成分モデルを提案した。
|
研究成果の学術的意義や社会的意義 |
標本マハラノビス距離(SMD)やRidge正則化SMDでは数値計算上の誤差により0値を中心に広がった分布をもつが、提案したスパース化SMDでは正確に0値のみをもつため、SMDの数値計算上の誤差に由来する不安定現象を除去可能となると期待される。 正値の母固有値の標本主成分について標本固有値・ベクトルのバラツキを考慮した標本Student化主成分モデルを用いれば、SMDの大きい試験データについて個々のスチューデント化主成分要素を検定した要因分析が可能になる。
|