2023 Fiscal Year Research-status Report
Sparse factor analysis in high-dimensional time series and its application to energy science
Project/Area Number |
23K11007
|
Research Institution | Kyushu University |
Principal Investigator |
廣瀬 慧 九州大学, マス・フォア・インダストリ研究所, 教授 (40609806)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Keywords | 因子分析モデル / 高次元時系列データ解析 / 欠測データ解析 |
Outline of Annual Research Achievements |
本研究では、多変量時系列データに基づいた高精度な予測モデルの構築を目指している。特に、電力需要予測の分野での実用的な問題解決への応用を想定し、複数の時系列データを活用してその合計値を予測する合計値予測に焦点を当てた。この研究で採用したアプローチは、合計値を目的変数とし、過去の電力使用量のデータや気温などの環境情報を説明変数として用いた回帰モデルである。これにより、合計値を対象とした予測が実現できるようになる。そこで、このモデルの予測性能と振る舞いを解析した。 その結果、時系列の数が増加すると、説明変数の次元も増加し、モデルの複雑度が高まることが数値的に確認された。また、このことが理論的に成り立つかどうか調べたところ、誤差の相関が正であるときに、世帯数が増えるとモデルの複雑度が増加することを示すことができた。とくに、世帯数が多い場合、パラメータ数が観測数を超えることさえあり、オーバーフィッティングの問題が生じてしまう。この問題に対処するため、世帯をクラスタリングすることで、説明変数の次元を抑制し、モデルの過学習を防ぐ方法を考えた。このクラスタリングによって、モデルのバイアスバリアンストレードオフを実現できる場合があることが示された。また、実データ解析及び数値シミュレーションを通じて、二重降下現象が起こることを確認した。二重降下現象は、深層学習でよく現れる最新のバイアスバリアンストレードオフの振る舞いであり、近年多くの研究者が取り組んでいるホットトピックである。 以上の研究成果を、国際会議で1件、国内学会で1件発表を行った。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当初の目標は、多変量時系列の予測を高精度に行うために因子分析モデルを適用することであった。今年度は、その前段階として、まずは複数の時系列の相関関係を活用することで、どの程度予測精度が向上するかを調べた。その結果、クラスタリングを行うことによって精度良く予測ができることが理論的にわかった。因子分析を直接適用したわけではないが、大量のデータを精度よく予測する一般的な理論を構築したという意味で進展したと言える。さらに、因子分析モデルはクラスタリングと大きく関連しており、今回の研究は、因子分析を行うことによってどのようにして予測精度が向上するかを理解する助けとなる内容である。
|
Strategy for Future Research Activity |
現段階ではまだ因子分析による予測を行っていないため、まずは電力需要のデータに因子分析を適用する。また、クラスタリングとの比較も行うため、Prenetによるクラスタリングを行い、合計値予測におけるクラスタリングの結果や予測精度の比較検証を行う。さらに、Prenet以外のクラスタリング手法(たとえば、k-meansやWard法)との比較も行う。理論的、数値的に様々な方法を比較することにより、因子分析を用いる有用性を明らかにする。
|
Causes of Carryover |
もともとは、因子分析の問題に取り組んで、国際会議で講演し、場合によっては海外に短期滞在して打ち合わせする予定であった。実際は因子分析を行う前の基礎研究を行っており、少し遅れている。来年度以降に因子分析に取り組んで国際会議での講演や短期滞在を行う。
|