高次元時系列解析におけるスパース因子分析とエネルギービッグデータへの応用

研究課題

研究課題/領域番号	23K11007
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分60030:統計科学関連
研究機関	九州大学
研究代表者	廣瀬慧九州大学, マス・フォア・インダストリ研究所, 教授 (40609806)
研究期間 (年度)	2023-04-01 – 2026-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円) 2025年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2024年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2023年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
キーワード	因子分析モデル / 高次元時系列データ解析 / 欠測データ解析
研究開始時の研究の概要	本研究では、因子分析モデルと状態空間モデルを融合させた多変量時系列モデリングを行う。時系列データの内在する構造を理解し、新たな知識発見へとつなげるためには、推定されたモデルを解釈することが必要不可欠となる。そこで、新たな正則化項に基づくスパース正則化法を提案する。とくに、Lasso等の従来のスパース推定法だけでなく、因子分析特有のスパース推定法である因子回転を拡張することにより、全く新しいスパース正則化法を提案する。この方法が実現すると、高精度に予測し、かつ結果を解釈できる手法として、様々な科学・産業に応用できるようになる。提案手法を実行するRパッケージを作成し、Web上に公開する。
研究実績の概要	本研究では、多変量時系列データに基づいた高精度な予測モデルの構築を目指している。特に、電力需要予測の分野での実用的な問題解決への応用を想定し、複数の時系列データを活用してその合計値を予測する合計値予測に焦点を当てた。この研究で採用したアプローチは、合計値を目的変数とし、過去の電力使用量のデータや気温などの環境情報を説明変数として用いた回帰モデルである。これにより、合計値を対象とした予測が実現できるようになる。そこで、このモデルの予測性能と振る舞いを解析した。その結果、時系列の数が増加すると、説明変数の次元も増加し、モデルの複雑度が高まることが数値的に確認された。また、このことが理論的に成り立つかどうか調べたところ、誤差の相関が正であるときに、世帯数が増えるとモデルの複雑度が増加することを示すことができた。とくに、世帯数が多い場合、パラメータ数が観測数を超えることさえあり、オーバーフィッティングの問題が生じてしまう。この問題に対処するため、世帯をクラスタリングすることで、説明変数の次元を抑制し、モデルの過学習を防ぐ方法を考えた。このクラスタリングによって、モデルのバイアスバリアンストレードオフを実現できる場合があることが示された。また、実データ解析及び数値シミュレーションを通じて、二重降下現象が起こることを確認した。二重降下現象は、深層学習でよく現れる最新のバイアスバリアンストレードオフの振る舞いであり、近年多くの研究者が取り組んでいるホットトピックである。以上の研究成果を、国際会議で1件、国内学会で1件発表を行った。
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由当初の目標は、多変量時系列の予測を高精度に行うために因子分析モデルを適用することであった。今年度は、その前段階として、まずは複数の時系列の相関関係を活用することで、どの程度予測精度が向上するかを調べた。その結果、クラスタリングを行うことによって精度良く予測ができることが理論的にわかった。因子分析を直接適用したわけではないが、大量のデータを精度よく予測する一般的な理論を構築したという意味で進展したと言える。さらに、因子分析モデルはクラスタリングと大きく関連しており、今回の研究は、因子分析を行うことによってどのようにして予測精度が向上するかを理解する助けとなる内容である。
今後の研究の推進方策	現段階ではまだ因子分析による予測を行っていないため、まずは電力需要のデータに因子分析を適用する。また、クラスタリングとの比較も行うため、Prenetによるクラスタリングを行い、合計値予測におけるクラスタリングの結果や予測精度の比較検証を行う。さらに、Prenet以外のクラスタリング手法（たとえば、k-meansやWard法）との比較も行う。理論的、数値的に様々な方法を比較することにより、因子分析を用いる有用性を明らかにする。

報告書

(1件)

2023 実施状況報告書

研究成果
(11件)

すべて 2024 2023

すべて雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (9件) (うち国際学会 4件、招待講演 2件)

[雑誌論文] ランダムでない欠測を含む時系列モデリング2024
- 著者名/発表者名
  馬場由羽貴、廣瀬慧
- 雑誌名
  
  日本統計学会誌
  
  巻: 53 号: 2 ページ: 275-296
- DOI
  10.11329/jjssj.53.275
- ISSN
  0389-5602, 2189-1478
- 年月日
  2024-02-27
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] Fast same-step forecast in SUTSE model and its theoretical properties2024
- 著者名/発表者名
  Yoshida Wataru、Hirose Kei
- 雑誌名
  
  Computational Statistics & Data Analysis
  
  巻: 190 ページ: 107861-107861
- DOI
  10.1016/j.csda.2023.107861
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] Factor analysis and its application to energy data analysis.2023
- 著者名/発表者名
  Hirose, K
- 学会等名
  Mathematical Research in Energy Systems I 2 CNER-IMI Joint International Workshop
- 関連する報告書
  2023 実施状況報告書
- 国際学会 / 招待講演
[学会発表] Statistical modeling for electricity demand forecasting.2023
- 著者名/発表者名
  Hirose, K
- 学会等名
  The Fifth Workshop on Interdisciplinary Sciences (WIS 2023)
- 関連する報告書
  2023 実施状況報告書
- 国際学会 / 招待講演
[学会発表] Aggregation value regression and its application to household demand forecasting2023
- 著者名/発表者名
  Hirose, K., Masuda, H., Matsui, H
- 学会等名
  10th International Congress on Industrial and Applied Mathematics（ICIAM 2023 TOKYO）
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] An algebraic approach to factor analysis.2023
- 著者名/発表者名
  Fukasaku, R., Hirose, K., Kabata, Y., Teramoto, K.
- 学会等名
  10th International Congress on Industrial and Applied Mathematics（ICIAM 2023 TOKYO）.
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] スパースペナルティを用いたバイクラスタリング2023
- 著者名/発表者名
  王際強, 廣瀬慧
- 学会等名
  2023年度統計関連学会連合大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] スパース動的回帰モデルによる複数時刻の時系列分析2023
- 著者名/発表者名
  吉田航, 廣瀬慧
- 学会等名
  2023年度統計関連学会連合大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 合計値回帰モデルにおけるクラスタリングによる二重降下現象と電力需要量予測への応用2023
- 著者名/発表者名
  廣瀬慧, 増田弘毅, 松井秀俊
- 学会等名
  2023年度統計関連学会連合大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 統計的ダイバージェンスを応用した高次元線形回帰モデルに対する正則化パラメータの頑健な選択について2023
- 著者名/発表者名
  倉田澄人, 廣瀬慧
- 学会等名
  2023年度統計関連学会連合大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 計算機代数に基づく因子分析の最尤推定2023
- 著者名/発表者名
  深作亮也，廣瀬慧，加葉田雄太朗，寺本圭佑
- 学会等名
  日本計算機統計学会第37回大会
- 関連する報告書
  2023 実施状況報告書

高次元時系列解析におけるスパース因子分析とエネルギービッグデータへの応用

研究代表者

廣瀬 慧 九州大学, マス・フォア・インダストリ研究所, 教授 (40609806)

4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[雑誌論文] ランダムでない欠測を含む時系列モデリング2024

著者名/発表者名

雑誌名

DOI

ISSN

年月日

関連する報告書

[雑誌論文] Fast same-step forecast in SUTSE model and its theoretical properties2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] Factor analysis and its application to energy data analysis.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Statistical modeling for electricity demand forecasting.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Aggregation value regression and its application to household demand forecasting2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] An algebraic approach to factor analysis.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] スパースペナルティを用いたバイクラスタリング2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] スパース動的回帰モデルによる複数時刻の時系列分析2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 合計値回帰モデルにおけるクラスタリングによる二重降下現象と電力需要量予測への応用2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 統計的ダイバージェンスを応用した高次元線形回帰モデルに対する正則化パラメータの頑健な選択について2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 計算機代数に基づく因子分析の最尤推定2023

著者名/発表者名

学会等名

関連する報告書

廣瀬慧九州大学, マス・フォア・インダストリ研究所, 教授 (40609806)