2019 Fiscal Year Research-status Report
Investigation of a new application of sparse modeling to an abonormality itself
Project/Area Number |
19K20224
|
Research Institution | Teikyo University |
Principal Investigator |
小林 靖之 帝京大学, 理工学部, 講師 (00604513)
|
Project Period (FY) |
2019-04-01 – 2021-03-31
|
Keywords | スパースモデリング / マハラノビス距離 / 母固有値の値0 / 母固有値0の標本主成分 / 母固有値0の標本固有値 / 浮動小数点演算 / 数値誤差 |
Outline of Annual Research Achievements |
①スパース化した標本マハラノビス距離モデルとその数値安定条件の提案・証明 スパース化異常度モデルとして次を提案した。具体的には、未知データxと標本共分散行列Sについて√Sz=xの一次連立方程式をCoordinate Descent法で解いて得たStudent化主成分ベクトルzからz'zをスパース化マハラノビス距離D2とするモデルである。事前に与える正則化定数が母固有値0の主成分の標準偏差より大きければ、母固有値0の標本主成分により生じる標本マハラノビス距離の誤差をD2が除去していることを成果として得た。この成果を2019年8月13-15日に京都市同志社大学で開催されたData Science, Statistics, and Visualization 2019 (DSSV2019)でポスター発表した。また下記②で得た標本主成分の提案モデルを用いて、標本マハラノビス距離の数値安定条件についてスパース化有無のモデルを現在検討中である。 ②スパース化した異常度における数値実験不要な正則化係数ρの決定法の提案 上記①の課題として母固有値0の主成分の標準偏差、特に確率分布モデルが不明であるために、事前に与える正則化定数も不明な点が問題である。そこで、本来母固有値0の標本主成分は正確に0であるが計算機の浮動小数点演算で生じる数値誤差によって微小な正値になる事実から、数値解析の手法により母固有値0の標本主成分における数値誤差の確率分布モデルを提案した。提案モデルが数値実験で正しいことを確認し、現在は論文誌への投稿を準備中である。また同時に検討を進めた母固有値0の主成分に当たる標本固有値の確率分布モデルが標本主成分のモデルと異なること、固有値計算として標本共分散行列の固有値分解とデータ行列の特異値分解で得られる標本固有値のモデルが異なることを理論で得たので数値実験で検証中である。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
スパース化した標本マハラノビス距離モデルを提案し、モデルの挙動を実際に数値実験で確認できたため、当初の計画通りに研究を進めて問題ないことが明らかになった。次の課題として、スパース化のために与える正則化定数を事前に決める方法を提案し検証する段階に入っている。研究実績の概要のとおり、浮動小数点演算による数値誤差に由来する確率分布モデルを利用して正則化定数を事前に決める方法を検討している。このために必要な母固有値0の主成分に当たる標本主成分と標本固有値の確率分布モデルを提案し数値実験で検証中であるため、当初の計画通りに進展していると考えている。
|
Strategy for Future Research Activity |
研究実績の概要や現在までの進捗状況に記載したとおり、当初の計画通りに進展していると考えているが、課題として提案モデルに不備が無いかを確認する必要がある。①スパース化した標本マハラノビス距離モデルとその数値安定条件の提案・証明では、提案モデルの計算にCoordinate Descent法によるLASSO解法を適用しているが、他の高性能なLASSO解法の適用や、事前に与える正則化定数の値に対するパラメータサーベイが手つかずであるので、これらを残された期間中に検討していく予定である。 ②スパース化した異常度における数値実験不要な正則化係数ρの決定法の提案では、提案モデルの基礎として計算機による浮動小数点演算での数値誤差を用いているが、数値誤差以外の他要素あるいは計算アルゴリズムが影響していないかを検討する必要がある。 以上を検討するため、国内学会や国際会議に参加し途中成果を学会発表して他の研究者の意見をいただく予定である。またプログラミング言語として現時点までMicrosoftExcelのVisualBasicを用いているが、他の言語、昨今の機械学習で幅広く利用されるPythonへ計算コードを移植し追試する予定である。また本研究の関わる分野は数理統計学の他に数値解析も加わるため、成果発表先として両者の視点で査読可能な論文誌の探索を継続する予定である。
|
Causes of Carryover |
次年度使用額が生じた理由は以下のとおりである。前倒し支払請求書の提出時の計画として、DSSV2019での採択から有望な研究成果と真値0の標本固有値モデルの関連事項の英文論文について、2019年後期のうちに1~2本の論文原稿の英文校正(1回約4万円)を依頼する予定であった。しかし、実際に論文執筆にとりかかったところ、関連研究の文献調査の追加や、提案モデルの再検討、数値実験のやり直しが生じて、さらに本研究のエフォート外の教育研究業務の遂行の必要もあり、論文執筆に予想よりも長い時間を要したため、次年度使用額が発生した。 次年度使用額と合わせた今後の使用計画として、提案モデルの数値実験による確認と論文執筆に関わる文献調査や英文校正、さらに国内学会・国際会議での学会発表や論文投稿を当初の計画に沿うように進めていく予定である。
|