• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

予測モデルのグループ化を目的とするクラスター分析とその応用

研究課題

研究課題/領域番号 19K11862
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分60030:統計科学関連
研究機関九州大学

研究代表者

廣瀬 慧  九州大学, マス・フォア・インダストリ研究所, 准教授 (40609806)

研究期間 (年度) 2019-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
キーワードクラスタリング / クロスバリデーション / 交差検証法 / 多変量解析 / Generalized Lasso / 予測モデリング / 予測モデル / 正準判別 / 合計値予測
研究開始時の研究の概要

近年,諸科学の分野で多様性を伴うビッグデータが取得されている.入力データもしくは出力データに多様性を伴う場合,単一の回帰分析や判別分析では予測精度が高くないことが多い.そこで,複数の予測モデルを構築することが考えられるが,あまり大量に予測モデルを作りすぎてもかえって予測精度が向上しないことがある.そこで本研究では,複数の予測モデルをグループ化する.これを実現するために,予測モデルに対するクラスター分析を行う.目的関数として,予測誤差に基づく関数を定義することにより,予測精度を向上させる.このモデルに含まれるパラメータを高速に推定するために,効率的な計算アルゴリズムを提案する.

研究成果の概要

本研究では、データに多様性を伴う場合に柔軟な予測モデルを構築した。具体的には、単一の回帰分析や判別分析を用いて予測するのでなく、複数の予測モデルを構築し、それらをグループ化することによって、グループごとに予測する方法を考案した。予測モデルをグループ化するためには、クラスター分析を行う必要がある。従来のクラスター分析では、距離行列等を用いてクラスタリングを行うが、本研究では、予測誤差に基づく関数を定義することにより、予測精度を向上を試みた。さらに、クラスタリングを高速に実行するために、効率的な計算アルゴリズムを構築した。

研究成果の学術的意義や社会的意義

近年、ディープラーニングを用いたデータ解析が主流となっているが、ディープラーニングは、画像やテキストなど、サンプルサイズが十分に大きい場合に精度の高い予測モデルが構築できる。一方で、遺伝子データや電力需要量データ、材料データ等、ディープラーニングが実行できるほどの多くの観測が得られないことがある。本研究では、このような場合に、できるだけ精度良く予測できる柔軟なモデルを提案した。また、モデルを新たに構築しただけでなく、高速なアルゴリズムの提案、さらにはRパッケージの公開も行った。

報告書

(4件)
  • 2021 実績報告書   研究成果報告書 ( PDF )
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (16件)

すべて 2022 2021 2020 2019

すべて 雑誌論文 (9件) (うち査読あり 5件、 オープンアクセス 8件) 学会発表 (7件) (うち国際学会 3件、 招待講演 2件)

  • [雑誌論文] Interpretable Modeling for Short- and Medium-Term Electricity Demand Forecasting2021

    • 著者名/発表者名
      Hirose Kei
    • 雑誌名

      Frontiers in Energy Research

      巻: 9

    • DOI

      10.3389/fenrg.2021.724780

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Sparse multivariate regression with missing values and its application to the prediction of material properties2021

    • 著者名/発表者名
      Teramoto Keisuke、Hirose Kei
    • 雑誌名

      International Journal for Numerical Methods in Engineering

      巻: 123 号: 2 ページ: 530-546

    • DOI

      10.1002/nme.6867

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Relationship between gene regulation network structure and prediction accuracy in high dimensional regression2021

    • 著者名/発表者名
      Okinaga Yuichi、Kyogoku Daisuke、Kondo Satoshi、Nagano Atsushi J.、Hirose Kei
    • 雑誌名

      Scientific Reports

      巻: 11 号: 1

    • DOI

      10.1038/s41598-021-90791-6

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Sparse multivariate regression with missing values and its application to the prediction of material properties2021

    • 著者名/発表者名
      Keisuke Teramoto, Kei Hirose
    • 雑誌名

      arXiv

      巻: arXiv:2103.09619 ページ: 1-18

    • 関連する報告書
      2020 実施状況報告書
    • オープンアクセス
  • [雑誌論文] Event Effects Estimation on Electricity Demand Forecasting2020

    • 著者名/発表者名
      Hirose Kei、Wada Keigo、Hori Maiya、Taniguchi Rin-ichiro
    • 雑誌名

      Energies

      巻: 13 号: 21 ページ: 5839-5839

    • DOI

      10.3390/en13215839

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Effects of underlying gene-regulation network structure on prediction accuracy in high-dimensional regression2020

    • 著者名/発表者名
      Okinaga Yuichi、Kyogoku Daisuke、Kondo Satoshi、Nagano Atsushi J.、Hirose Kei
    • 雑誌名

      bioRxiv

      巻: なし ページ: 1-12

    • DOI

      10.1101/2020.09.11.293456

    • 関連する報告書
      2020 実施状況報告書
    • オープンアクセス
  • [雑誌論文] Interpretable modeling for short- and medium-term electricity load forecasting2020

    • 著者名/発表者名
      Kei Hirose
    • 雑誌名

      arXiv

      巻: arXiv:2006.01002 ページ: 1-29

    • 関連する報告書
      2020 実施状況報告書
    • オープンアクセス
  • [雑誌論文] L1正則化法に基づく因子分析および構造方程式モデリングの最近の展開2020

    • 著者名/発表者名
      廣瀬慧
    • 雑誌名

      計算機統計学

      巻: -

    • NAID

      130007877407

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] 因子分析モデルにおける構造正則化2020

    • 著者名/発表者名
      廣瀬慧
    • 雑誌名

      京都大学 数理解析研究所 講究録

      巻: 2133 ページ: 1-10

    • 関連する報告書
      2019 実施状況報告書
    • オープンアクセス
  • [学会発表] Sparse multivariate regression with missing values and its application to material properties prediction2022

    • 著者名/発表者名
      Hirose, K., and Teramoto, K.
    • 学会等名
      IASC-ARS2022 (The 11th Conference of the IASC-ARS)
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] 回帰モデルの合計値予測とクラスタリング2021

    • 著者名/発表者名
      廣瀬 慧、増田 弘毅
    • 学会等名
      2021年度 統計関連学会連合大会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] クロスバリデーションに基づく正準判別のクラスタリングとその高速化2021

    • 著者名/発表者名
      三浦 完太, 廣瀬 慧
    • 学会等名
      2021年度 統計関連学会連合大会
    • 関連する報告書
      2021 実績報告書
  • [学会発表] Hierarchical multiclass discriminant analysis via cross-validation2021

    • 著者名/発表者名
      Hirose, K., and Miura, K.
    • 学会等名
      The 4th International Conference on Econometrics and Statistics (EcoSta 2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] 電力需要予測のための統計モデルとソフトウェア2020

    • 著者名/発表者名
      廣瀬慧
    • 学会等名
      2020年度 統計関連学会連合大会
    • 関連する報告書
      2020 実施状況報告書
  • [学会発表] 電力需要の短期予測のための統計モデリング2019

    • 著者名/発表者名
      廣瀬 慧,増田 弘毅
    • 学会等名
      2019年度統計関連学会連合大会
    • 関連する報告書
      2019 実施状況報告書
  • [学会発表] Cluster-based multiclass linear discriminant analysis2019

    • 著者名/発表者名
      K. Hirose, K. Miura, A. Koie
    • 学会等名
      The 3rd International Conference on Econometrics and Statistics (EcoSta 2019)
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会

URL: 

公開日: 2019-04-18   更新日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi