研究課題/領域番号 |
23K11007
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 九州大学 |
研究代表者 |
廣瀬 慧 九州大学, マス・フォア・インダストリ研究所, 教授 (40609806)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2023年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 因子分析モデル / 高次元時系列データ解析 / 欠測データ解析 |
研究開始時の研究の概要 |
本研究では、因子分析モデルと状態空間モデルを融合させた多変量時系列モデリングを行う。時系列データの内在する構造を理解し、新たな知識発見へとつなげるためには、推定されたモデルを解釈することが必要不可欠となる。そこで、新たな正則化項に基づくスパース正則化法を提案する。とくに、Lasso等の従来のスパース推定法だけでなく、因子分析特有のスパース推定法である因子回転を拡張することにより、全く新しいスパース正則化法を提案する。この方法が実現すると、高精度に予測し、かつ結果を解釈できる手法として、様々な科学・産業に応用できるようになる。提案手法を実行するRパッケージを作成し、Web上に公開する。
|
研究実績の概要 |
本研究では、多変量時系列データに基づいた高精度な予測モデルの構築を目指している。特に、電力需要予測の分野での実用的な問題解決への応用を想定し、複数の時系列データを活用してその合計値を予測する合計値予測に焦点を当てた。この研究で採用したアプローチは、合計値を目的変数とし、過去の電力使用量のデータや気温などの環境情報を説明変数として用いた回帰モデルである。これにより、合計値を対象とした予測が実現できるようになる。そこで、このモデルの予測性能と振る舞いを解析した。 その結果、時系列の数が増加すると、説明変数の次元も増加し、モデルの複雑度が高まることが数値的に確認された。また、このことが理論的に成り立つかどうか調べたところ、誤差の相関が正であるときに、世帯数が増えるとモデルの複雑度が増加することを示すことができた。とくに、世帯数が多い場合、パラメータ数が観測数を超えることさえあり、オーバーフィッティングの問題が生じてしまう。この問題に対処するため、世帯をクラスタリングすることで、説明変数の次元を抑制し、モデルの過学習を防ぐ方法を考えた。このクラスタリングによって、モデルのバイアスバリアンストレードオフを実現できる場合があることが示された。また、実データ解析及び数値シミュレーションを通じて、二重降下現象が起こることを確認した。二重降下現象は、深層学習でよく現れる最新のバイアスバリアンストレードオフの振る舞いであり、近年多くの研究者が取り組んでいるホットトピックである。 以上の研究成果を、国際会議で1件、国内学会で1件発表を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
当初の目標は、多変量時系列の予測を高精度に行うために因子分析モデルを適用することであった。今年度は、その前段階として、まずは複数の時系列の相関関係を活用することで、どの程度予測精度が向上するかを調べた。その結果、クラスタリングを行うことによって精度良く予測ができることが理論的にわかった。因子分析を直接適用したわけではないが、大量のデータを精度よく予測する一般的な理論を構築したという意味で進展したと言える。さらに、因子分析モデルはクラスタリングと大きく関連しており、今回の研究は、因子分析を行うことによってどのようにして予測精度が向上するかを理解する助けとなる内容である。
|
今後の研究の推進方策 |
現段階ではまだ因子分析による予測を行っていないため、まずは電力需要のデータに因子分析を適用する。また、クラスタリングとの比較も行うため、Prenetによるクラスタリングを行い、合計値予測におけるクラスタリングの結果や予測精度の比較検証を行う。さらに、Prenet以外のクラスタリング手法(たとえば、k-meansやWard法)との比較も行う。理論的、数値的に様々な方法を比較することにより、因子分析を用いる有用性を明らかにする。
|