Project/Area Number |
19K11862
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60030:Statistical science-related
|
Research Institution | Kyushu University |
Principal Investigator |
Hirose Kei 九州大学, マス・フォア・インダストリ研究所, 准教授 (40609806)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥4,420,000 (Direct Cost: ¥3,400,000、Indirect Cost: ¥1,020,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2019: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
|
Keywords | クラスタリング / クロスバリデーション / 交差検証法 / 多変量解析 / Generalized Lasso / 予測モデリング / 予測モデル / 正準判別 / 合計値予測 |
Outline of Research at the Start |
近年,諸科学の分野で多様性を伴うビッグデータが取得されている.入力データもしくは出力データに多様性を伴う場合,単一の回帰分析や判別分析では予測精度が高くないことが多い.そこで,複数の予測モデルを構築することが考えられるが,あまり大量に予測モデルを作りすぎてもかえって予測精度が向上しないことがある.そこで本研究では,複数の予測モデルをグループ化する.これを実現するために,予測モデルに対するクラスター分析を行う.目的関数として,予測誤差に基づく関数を定義することにより,予測精度を向上させる.このモデルに含まれるパラメータを高速に推定するために,効率的な計算アルゴリズムを提案する.
|
Outline of Final Research Achievements |
We constructed flexible statistical modeling for capturing complex structures in data. Specifically, instead of using a single regression or discriminant analysis, we constructed multiple statistical models and grouped them; then, a prediction was performed for each group. To group the statistical models, a cluster analysis was performed. Conventional cluster analysis adopted a distance matrix. On the other hand, we defined a function based on the prediction error to improve the prediction accuracy. Furthermore, an efficient computational algorithm to perform clustering was established.
|
Academic Significance and Societal Importance of the Research Achievements |
近年、ディープラーニングを用いたデータ解析が主流となっているが、ディープラーニングは、画像やテキストなど、サンプルサイズが十分に大きい場合に精度の高い予測モデルが構築できる。一方で、遺伝子データや電力需要量データ、材料データ等、ディープラーニングが実行できるほどの多くの観測が得られないことがある。本研究では、このような場合に、できるだけ精度良く予測できる柔軟なモデルを提案した。また、モデルを新たに構築しただけでなく、高速なアルゴリズムの提案、さらにはRパッケージの公開も行った。
|