研究課題/領域番号 |
19K11862
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60030:統計科学関連
|
研究機関 | 九州大学 |
研究代表者 |
廣瀬 慧 九州大学, マス・フォア・インダストリ研究所, 准教授 (40609806)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
|
キーワード | クラスタリング / クロスバリデーション / 交差検証法 / 多変量解析 / Generalized Lasso / 予測モデリング / 予測モデル / 正準判別 / 合計値予測 |
研究開始時の研究の概要 |
近年,諸科学の分野で多様性を伴うビッグデータが取得されている.入力データもしくは出力データに多様性を伴う場合,単一の回帰分析や判別分析では予測精度が高くないことが多い.そこで,複数の予測モデルを構築することが考えられるが,あまり大量に予測モデルを作りすぎてもかえって予測精度が向上しないことがある.そこで本研究では,複数の予測モデルをグループ化する.これを実現するために,予測モデルに対するクラスター分析を行う.目的関数として,予測誤差に基づく関数を定義することにより,予測精度を向上させる.このモデルに含まれるパラメータを高速に推定するために,効率的な計算アルゴリズムを提案する.
|
研究成果の概要 |
本研究では、データに多様性を伴う場合に柔軟な予測モデルを構築した。具体的には、単一の回帰分析や判別分析を用いて予測するのでなく、複数の予測モデルを構築し、それらをグループ化することによって、グループごとに予測する方法を考案した。予測モデルをグループ化するためには、クラスター分析を行う必要がある。従来のクラスター分析では、距離行列等を用いてクラスタリングを行うが、本研究では、予測誤差に基づく関数を定義することにより、予測精度を向上を試みた。さらに、クラスタリングを高速に実行するために、効率的な計算アルゴリズムを構築した。
|
研究成果の学術的意義や社会的意義 |
近年、ディープラーニングを用いたデータ解析が主流となっているが、ディープラーニングは、画像やテキストなど、サンプルサイズが十分に大きい場合に精度の高い予測モデルが構築できる。一方で、遺伝子データや電力需要量データ、材料データ等、ディープラーニングが実行できるほどの多くの観測が得られないことがある。本研究では、このような場合に、できるだけ精度良く予測できる柔軟なモデルを提案した。また、モデルを新たに構築しただけでなく、高速なアルゴリズムの提案、さらにはRパッケージの公開も行った。
|